Skip to content

Latest commit

 

History

History
4 lines (3 loc) · 661 Bytes

README.md

File metadata and controls

4 lines (3 loc) · 661 Bytes

persian_plagiarism

در این پروژه میزان شباهت متن دوم به متن اول محاسبه کردیم بدینصورت که ابتدا هردو متن را خوانده و یک دیکشنری از کلمات ساختیم سپس به هر کلمه یکتا یک عدد نسبت داده و بردار هر متن را تولید کردیم و در نهایت جملات دو متن، نظیر به نظیر بررسی شده و اگر اشتراکشان بیشتر از یک حد آستانه بود، آن جمله کپی تشخیص داده می شد.

result