در این پروژه میزان شباهت متن دوم به متن اول محاسبه کردیم بدینصورت که ابتدا هردو متن را خوانده و یک دیکشنری از کلمات ساختیم سپس به هر کلمه یکتا یک عدد نسبت داده و بردار هر متن را تولید کردیم و در نهایت جملات دو متن، نظیر به نظیر بررسی شده و اگر اشتراکشان بیشتر از یک حد آستانه بود، آن جمله کپی تشخیص داده می شد.