در این پروژه میزان شباهت متن دوم به متن اول محاسبه کردیم بدینصورت که ابتدا هردو متن را خوانده و یک دیکشنری از کلمات ساختیم سپس به هر کلمه یکتا یک عدد نسبت داده و بردار هر متن را تولید کردیم و در نهایت جملات دو متن، نظیر به نظیر بررسی شده و اگر اشتراکشان بیشتر از یک حد آستانه بود، آن جمله کپی تشخیص داده می شد.
-
Notifications
You must be signed in to change notification settings - Fork 0
datahub-ir/persian_plagiarism
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
simple plagiarism checker for persian
Topics
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published