Master studije
- Aleksandar Anžel 1025/2018
- Problem koji se rešava je utvrđivanje N-vezane glikozilovanosti proteina pomoću metoda potpornih vektora i potpuno povezanih neuronskih mreža, na osnovu kreiranih fizičko-hemijskih svojstava. Korišćen skup podataka sadrži nebalansiranost klasa, te se koriste različite tehnike za prevazilaženje tog problema.
- Datoteke su u potpunosti prilagođene pokretanju unutar Google Colaboratory okruženja.
- Informacije o korišćenim podacima su prisutne unutar Main_1.ipynb datoteke, kao i unutar Master_rad.pdf datoteke.
- Podaci koji predstavljaju ulaze modela mašinskog učenja se generišu na osnovu postupka opisanog u Master_rad.pdf datoteci.
- Intenzivno se koriste Biopython, SciKit-Learn, Keras, Numpy, Pandas, Matplotlib i ostale srodne biblioteke.