GMAP

Trabalhos Apresentados no 22º Salão de Inicialização Científica da PUCRS

Entre os dias 4 e 8 de outubro de 2021, ocorreu a 22ª edição do Salão de Iniciação Científica (SIC) da Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS), promovido pela Pró-Reitoria de Pesquisa e Pós-graduação da PUCRS. O objetivo do SIC é proporcionar o intercâmbio de conhecimentos e dos resultados das pesquisas desenvolvidas pelos bolsistas de Iniciação Científica em projetos orientados por pesquisadores e promover a divulgação da pesquisa no âmbito da Graduação da Universidade e da comunidade científica e acadêmica em geral. Além disso, o evento tem como objetivo incentivar a participação dos alunos de Graduação em Programas de Iniciação Científica, visto que essa é uma atividade que proporciona aos alunos a aprendizagem de técnicas e métodos de pesquisa e estimular o desenvolvimento do pensar científico e da criatividade.

O SIC é um evento para estudantes de graduação e professores/pesquisadores de diferentes universidades e instituições de pesquisa regionais e/ou brasileiras. Neste ano a 22ª edição do SIC ocorreu de maneira online e síncrona, devido às recomendações dos órgãos oficiais de saúde e determinações institucionais de isolamento social visando a prevenção ao SARS-CoV-2.

Neste ano, 5 alunos de iniciação científica do GMAP apresentaram seus trabalhos no 22º SIC:

Adaptação da Métrica de Halstead para Avaliar Aplicações Paralelas

Bruno Thofehrn, Gabriella Andrade (co-orientadora), Dalvan Griebler (co-orientador), Luiz Gustavo Leão Fernandes (orientador)

“Inicialmente realizamos atividades de estudo com o Bruno, onde ele estudou sobre métricas de codificação aplicadas à programação paralela, técnicas de engenharia de software utilizadas para estimativa de esforço de desenvolvimento, experimentos com usuários, entre outras técnicas. Após a etapa de estudo, identificamos a necessidade de adaptar as métricas de codificação ao domínio de programação paralela. A métrica de Halstead foi escolhida como uma primeira candidata, por ser fácil de ser utilizada pois é baseada no número de operadores e operandos da linguagem de programação. Exemplos de operadores são os aritméticos, lógicos, e relacionais. Além disso, as palavras reservadas também são consideradas operadores. Constantes, nomes de variáveis, classes e funções não nativas são considerados operandos. Em seguida realizamos um revisão da literatura para identificar as ferramentas utilizadas para medir tal métrica. Nenhuma das ferramentas encontradas era focada na avaliação de aplicações paralelas, ou seja não considerava as palavras reservadas das interfaces de programação paralelas como operandos. Identificamos a ferramenta Commented Code Detector  como uma possível candidata à modificação, pois a mesma é fácil de ser instalada e utililizada, e é compatível com a linguagem de programação C++. Em trabalhos futuros pretendemos propor uma modificação à ferramenta Commented Code Detector com o objetivo de contornar essas limitações. Dessa forma esperamos ser capazes de avaliar aplicações paralelas de maneira mais efetiva, obtendo indicadores de produtividade e esforço de desenvolvimento.”

Gabriella Andrade

Benchmarks para Processamento Paralelo de Stream

André Sacilotto Santos, Adriano Garcia (coorientador), Dalvan Griebler (coorientador), Luiz Gustavo Leao Fernandes (orientador)

“Desde o início do projeto me deparei com vários desafios, tais como a ambientação com o sistema operacional Linux e o aprendizado de nova linguagem, o C++, aplicada posteriormente em um contexto totalmente novo para mim. Ao adentrar neste contexto de programação paralela passei por muitas dificuldades. Porém, com a intensa ajuda e auxílio de meus orientadores pude ter êxito na introdução com diversas interfaces de programação paralela, tais como como SPar, Intel TBB, Fastflow, e Threads nativas do C++. Desde o início, o Adriano Garcia vem me auxiliando de perto, promovendo minha evolução em nossa área e contribuindo para que eu possa adquirir qualidades necessárias para um pesquisador. De outra maneira, o prof. Dalvan Griebler pode me incentivar e mostrar cada vez mais a beleza de nossa área e sua importância, planejando meu desenvolvimento em conjunto com o prof. Gustavo Fernandes. Com tudo isto decorrido, pude redigir o resumo do Salão de Iniciação Científica que foi aceito. Depois, na apresentação foram incluídos resultados parciais em relação a uma nova interface chamada GrPPI, usada no benchmark SPBench referente ao trabalho do Adriano Garcia. Nessa gama de novas informações em relação ao resumo, tive alguma dificuldade de organizá-las de maneira concisa em meu planejamento, o que acabou servindo como um grande aprendizado a partir dos ensaios e trocas de informação que tive com o grupo e posteriormente, com a banca avaliadora.”

André Sacilotto Santos

Ciência de dados aplicada à biodiversidade: integração de dados moleculares e análises ecológicas em grande escala para monitorar a biodiversidade

Caetano Bordin Muller, Dalvan Griebler (orientador), Eduardo Eizirik (orientador)

“Desde que fui incluído no projeto tive um grande apoio do meu orientador Dalvan e outros membros do GMAP. É claro tive minhas dificuldades, mas nada impossível de ser superado. Entrei no projeto sem nenhum conhecimento e programando apenas em java hoje já me sinto confortável em 4 outras linguagens de programação, além de ter tido é claro um contato direto com Machine Learning pela primeira vez. Sinto que aprendi nesses 5 meses de projeto mais do que eu aprenderia em 3 anos caso estivesse contido apenas a estudar os conteúdos das cadeiras da graduação. Sou muito grato pelo apoio de todos os membros do GMAP que constantemente me ajudam no meu começo de vida acadêmica. Tive um resultado relativamente bom nas apresentações do SIC, mas sou uma pessoa muito ambiciosa e quero dar o meu melhor para ser selecionado como trabalho destaque no futuro. Acredito que ainda tenho muito que aprender e será uma longa jornada, mas é algo que amo fazer e estou muito ansioso para ver meu progresso no futuro.”

Caetano Bordin Muller

Tecnologias de processamento paralelo de stream para soluções de visualização de dados geoespaciais 

Fernanda de Mello, Dalvan Griebler (co-orientador), Luiz Gustavo Leão Fernandes (orientador), Isabel Manssour (orientadora)

“Quando entrei no projeto como IC, tinha muito pouco conhecimento técnico e de problemas que são estudados dentro da área da computação. Nos primeiros meses, pude estudar as linguagens C e C++, redes e protocolos de comunicação, e me familiarizar com o sistema operacional Linux, por exemplo. Além disso, tive pela primeira vez contato com conceitos de paralelismo, tendo a oportunidade de conhecer diferentes interfaces para programação paralela, formando uma base de conhecimento e uma rotina de estudo que me ajuda bastante durante a faculdade e nos estudos em geral. A partir de 2021, comecei a participar de forma mais próxima no projeto em que fui inserida, que é uma colaboração entre os laboratórios DaVInt e GMAP da PUCRS visando a integração de duas tecnologias de visualização, a DSL GMaVis e o sistema GeoMultiVis, para permitir o processamento de grandes volumes de dados geoespaciais multivariados. Desde então, estive estudando a tecnologia para processamento de stream Apache Flink a fim de comparar o seu desempenho ao obtido pela linguagem SPar e entender qual tecnologia para paralelismo de stream seria interessante para o problema. Para isso, a partir de um acompanhamento semanal com o Dalvan Griebler, que colaborou muito para o meu crescimento nesse período, implementei versões Java e Flink de aplicações já desenvolvidas no laboratório: Bzip2, Person Recognizer e Ferret (em andamento). Ademais, os resultados até então obtidos foram apresentados na Escola Regional de Alto Desempenho da Região Sul em abril de 2021, sendo esta a minha primeira experiência com um artigo científico (ainda que bem curto) e no Seminário e Salão de Iniciação Científica da PUCRS, de forma que também consegui adquirir mais experiência apresentando trabalhos e me comunicando, o que foi muito positivo pra mim.”

Fernanda de Mello

Ciência de Dados para Análise Preditiva de Risco em Sífilis Congênita

João Vittor Caumo, Rita Mattiello (orientadora), Dalvan Griebler (orientador)

Mais informações sobre o 22º SIC podem ser encontradas no site oficial. Todas as publicações podem ser encontradas nos anais do SIC.

By: Gabriella Andrade