ALGORITMOS E FERRAMENTAS PARA BIOINFORMÁTICA

Categorias: Pesquisa

Início: 03/2017 Fim: 08/2020

Este projeto tem como finalidade pesquisar métodos e técnicas de bioinfomática para serem aplicados em áreas de conhecimento tais como a computação, agronomia, entre outras. Além disto, propõe a criação e integração de ferramentas que auxiliam no processo de análise dos dados obtidos pela bioinformática.

Ex-Integrante (s):

  • Márcio José Gurka Júnior
  • Kaio Pablo Gomes



Coordenadores

Simone Nasser Matos

Acessar currículo

Colaboradores

Prof. Dr. Alexandre Rossi Paschoal

Prof. Dr. Vinicius Ramos Henriques Maracajá Coutinho

Produtos gerados

CONTRIBUTIONS OF BIOINFORMATICS FOR COMPUTING EDUCATION IN THE DETECTION OF PROGRAMMING ASSIGNMENT PLAGIARISM

Any source code can be modified in several ways to confuse plagiarism detection systems. Such diverse modifications require the usage of systems which can handle different types of plagiarism. The usage of automatic source code plagiarism detectors has implications for computing education. This paper extends Pedersen's work, a Bioinformatics method, by performing the application of this method on programming plagiarism domain, and by analyzing the usage of such tools through a discussion associated with the support for professors in assessing students assignments. The application results are compared to a commonly used solution for the same purpose, the JPLAG tool. As a result of the evaluating study, the applied method showed a higher rate of similarity for specific types of plagiarism. Also, as a result of the analysis involving the use of an automatic tool for plagiarism in programming showed the benefits for computing education.


A BIOINFORMATICS APPROACH TO DETECT PLAGIARISM IN SOURCE CODE

This research proposes a novel approach based on a bioinformatics inspired method to improve plagiarism detection performance and accuracy. The main goal of this proposal is dealing with different types of modifications on plagiarized source code following the classification of programming plagiarism elaborated by [Faidhi and Robinson 1987]. The proposed approach works with the premise of modeling a source code into a synthetic DNA sequence and executing alignment among these types of sequence to identify similarities.


MIRQUEST 2: SOLUÇÃO COMPUTACIONAL PARA INTEGRAÇÃO DE FERRAMENTAS DE PREDIÇÃO DE MICRO RNA UTILIZANDO BALANCEAMENTO DE CARGA

A bioinformática é um campo de estudo que tem a necessidade de construção de ferramentas que trabalham de forma otimizada e possuem um tempo de resposta rápido para o usuário. O material de estudo dessa área vem principalmente dos grupos de cadeias genéticas, dentre os quais, o micro RNA é a classe escolhida para estudo e por isso, foram selecionadas ferramentas de predição desse tipo específico de molécula genética Mirinho e miRBoost de forma à serem integradas em um único ambiente. A solução foi denominada miRQuest 2 e para a integração foi utilizado o balanceamento de carga por meio do algoritmo de Round Robin, além disso, foi utilizada a linguagem de programação Python para a construção de uma API integrada com uma interface desenvolvida em React para realização do processamento de uma cadeia FASTA da base de dados miRBase. Este algoritmo fornece otimizações e o tempo de resposta foi considerado satisfatório. A diferença de tempo de execução da ferramenta Mirinho na linha de comando e da solução computacional foi de 20%, enquanto que na ferramenta miRBoost foi de 5%.


BIOPLAG: ABORDAGEM DE DETECÇÃO DE PLÁGIO EM CÓDIGO-FONTE UTILIZANDO BIOINFORMÁTICA

O problema do plágio em programação afeta desde o meio acadêmico até a industria de softwares. Considerando a importância deste domínio de estudo, diversas abordagens desenvolveram ferramentas para automatizarem a detecção de plágio em programação, mas as soluções propostas não contemplam os mais diversos níveis ou tipos de modificações encontradas em códigosfonte plagiados. A abordagem proposta neste trabalho busca contemplar todos os níveis de modificações encontrados em códigos de programação seguindo uma classificação proposta na literatura. O funcionamento da solução proposta é fundamentado em técnicas da bioinformática e da ciência da computação. As seguintes técnicas são utilizadas: modelo de DNA sintético, alinhamento de sequências de DNA sintético e tokens. A avaliação da abordagem será realizada por meio de sete cenários de teste com um total de 253 códigos-fonte a serem verificados por diferentes níveis de plágio, e considerando em cada cenário os parâmetros avaliativos de experimentos: Precision e Recall. Esta abordagem pode detectar diferentes níveis de plágio em programação, além proporcionar o suporte a diferentes linguagens e maior eficiência na complexidade de tempo em relação a outras soluções como a JPLAG.


APLICAÇÃO DE BIOINFORMÁTICA PARA RECONHECIMENTO DE PLÁGIO EM CÓDIGOS DE PROGRAMAÇÃO

A bioinformática é um estudo interdisciplinar que busca a solução para problemas de diferentes áreas da ciência tais como: biologia molecular, biologia celular, bioquímica, química, física e computação. Para a computação, a bioinformática pode resolver problemas tal como a detecção de vírus de computador, usando uma metodologia que se baseia em arquivo código. Esta metodologia pode ser usada na detecção de plágio em código de programação, pois estes possuem também um arquivo binário. Este trabalho realizou a aplicação desta metodologia no domínio de reconhecimento de plágio em códigos de programação criando um conjunto de teste para mostrar a sua viabilidade. Os resultados da aplicação dos testes mostram o potencial da metodologia, porém dificuldades em identificar alguns tipos de plágios foram encontradas e melhorias tais como: utilização de filtros de normalização de códigos de programação e mudança no modelo de alinhamento de sequências foram apresentadas para superar eventuais desafios.


DETECTION OF PROGRAMMING PLAGIARISM IN COMPUTING EDUCATION: A SYSTEMATIC MAPPING STUDY

The programming plagiarism is increasingly a problem in computing education, and the proposed solutions for this growing concern rely on automatic detectors. The usage of the automatic tools for this purpose can provide benefits in education for professors and instructors of programming assignments, besides, to avoid the lack of essential skills from the students since they compromise their programming logic by plagiarizing. This paper performs a systematic mapping study aligned with a snowballing technique to analyzes the existing solutions for this domain. As contributions, tendencies, as well as information analysis, are provided to guide new proposals of solutions.


Laboratório de Engenharia de Software e Inteligência Computacional

Siga-nos