Detecció d’autoria per a validar la identitat i evitar el plagi en les pràctiques de la UOC

Descripció 

Aquest projecte consisteix en l’aplicació de tècniques de processament de llenguatge natural (PLN) per identificar patrons d’escriptura de l’autor i així permetre comparar la “forma” d'escriure entre documents. Cada persona tenim una forma d’escriure diferent a una altra i la forma d’escriure ens identifica i ens diferencia respecte una altra persona. A més, quan copiem literalment algun text d’una altra font, per exemple, una article trobat per Internet o d’un llibre, es detecta de forma ràpida que aquella “forma d’escriure” no és la nostra.

L’inLab se’n encarregar de desenvolupar el prototipus d’aquesta projecte. Es basa en recollir per cada document amb autor conegut, un conjunt d’indicadors com allargada de els paraules, allargada de les frases, riquesa de vocabulari, freqüència de les paraules, etc.

El projecte indicarà la probabilitat de plagi al introduir un document nou d’autor desconegut. El que farà és assignarà amb quina probabilitat aquest document pertany a l’autor per cada un dels indicadors identificats i mitjançant una sèrie d’algoritmes de classificació (Support Vector Machine, Knn....).

Període del projecte 
Juny, 2015 - Octubre, 2015
Col·laboradors 
Tecnologia 
PLN (Processament de Llenguatges Naturals),
MySQL,
Python
Àrees d'expertesa aplicades al projecte 
Responsable 

Segueix-nos a

Els nostres articles del bloc d'inLab FIB

         
         

inLab FIB incorpora esCert

Icona ESCERT

inLab és membre de