Detecció d’autoria per a validar la identitat i evitar el plagi en les pràctiques de la UOC

Període:

juny, 2015 –
octubre, 2015

Client:

Entitat finançadora:

Responsable:

Equip participant inLab FIB:

Experteses:

Tecnologies:

Detecció d’autoria per a validar la identitat i evitar el plagi en les pràctiques de la UOC

Descripció

Aquest projecte consisteix en l’aplicació de tècniques de processament de llenguatge natural (PLN) per identificar patrons d’escriptura de l’autor i així permetre comparar la “forma” d’escriure entre documents. Cada persona tenim una forma d’escriure diferent a una altra i la forma d’escriure ens identifica i ens diferencia respecte una altra persona. A més, quan copiem literalment algun text d’una altra font, per exemple, una article trobat per Internet o d’un llibre, es detecta de forma ràpida que aquella “forma d’escriure” no és la nostra.

L’inLab se’n encarregar de desenvolupar el prototipus d’aquesta projecte. Es basa en recollir per cada document amb autor conegut, un conjunt d’indicadors com allargada de els paraules, allargada de les frases, riquesa de vocabulari, freqüència de les paraules, etc.

El projecte indicarà la probabilitat de plagi al introduir un document nou d’autor desconegut. El que farà és assignarà amb quina probabilitat aquest document pertany a l’autor per cada un dels indicadors identificats i mitjançant una sèrie d’algoritmes de classificació (Support Vector Machine, Knn….).