sistem online de verificare a autenticit ăţii documentelor
DESCRIPTION
Sistem online de verificare a autenticit ăţii documentelor. Proiect realizat de Radu -Constantin Ciob ănică Coordonat de S.L. Dr. Ing. Iulian Niţă. Structura lucrării. Forme de plagiat Scenarii vizate Metode de evitare Algoritmul Smith -Waterman Algoritmul Boyer-Moore - PowerPoint PPT PresentationTRANSCRIPT
Sistem online de verificare a autenticităţii documentelor
Proiect realizat de Radu-Constantin Ciobănică
Coordonat de S.L. Dr. Ing. Iulian Niţă
Structura lucrării•Forme de plagiat•Scenarii vizate•Metode de evitare•Algoritmul Smith-Waterman•Algoritmul Boyer-Moore•Criterii de performanţă•Comparaţie între algoritmi•Concluzii• Implementare
Forme de plagiat•Copy & paste•Schimbarea cuvintelor •Plagiatul de stil•Plagiatul metaforei•Plagiatul de idei
Scenarii vizate• Boyer-Moore:
▫copy&paste▫schimbare ordine de apariţie
• Smith-Waterman:▫cuvinte derivate▫plagiat de stil▫plagiat metafore
Tehnici de evitare•Înţelegerea plagiatului•Folosirea surselor multiple•Semnele citării – ghilimelele•Referinţe la parafraze•Referinţe la reformulare sau rezumare•Precizarea surselor
Smith-Waterman•Compară segmente de toate lungimile•Găseşte similarităţi structurale
1. Preprocesare: ▫Iniţializare matrici▫Maparea caracterelor
Smith-Waterman2. Calcularea matricii de scoruri
Smith-Waterman
3. Calcularea părinţilor (traceback)
Smith-Waterman
4. Identificare potriviri semnificative▫Decizie dependentă de valoarea scorului
5. Populare matrice M.
Boyer-Moore•Analiza se face de la
dreapta la stânga•Căutare la nivel de
pattern•Dispune de shift-ări
inteligente
Boyer-Moore1. Preprocesare: • Indexare • Generare tabele shift-areîn funcţie de ocurenţă
Boyer-Moore2. Aliniere pattern3. Compararea cu ultimul caracter:• Shift-are caracter greşit(distinct)
Boyer-Moore• Shift-are cu sufix bun- shift-are 2 poziţii
Boyer-Moore• Shift-are cu sufix bun- shift-are 5 poziţii
Criterii de performanţăSmith-Waterman:• Complexitate temporală:O(M+N) + O(MN) + O(MN) =
O(MN)Iniţializare umplere matr traceback
Boyer-Moore:• faza de preprocesare O(M + N) de timp şi spaţiu;• faza de căutare în O(MN);• performanţă maximă O(N/M)
Comparaţie algoritmi•Dimensiune eşantion / şir:•Eficienţa în timp•Spaţiu de stocare necesar•Ţinta analizei
Concluzii•“Ligi” diferite•Funcţionalităţi complementare•Performanţe complementare
Implementare