Releases: alcatraz-rm/Text_tone_analyzer
Releases · alcatraz-rm/Text_tone_analyzer
Pre-release v5.0.2-a.570
Alpha version.
Changes:
- Speed Up (add multithreading);
- Improve safety and refactor;
- Add console mode for Demo;
- Create configs for Services and Demo.
- Improve exceptions handling (add special service - ExceptionHandler);
- Delete C# files;
Pre-release v5.0.2-pa.495
Small refactoring and bug fixes.
Pre-release v5.0.2-pa.491
Improvements in this pre-alpha version:
- Fixed bugs in NgramAnalyzer (vector model).
- Improved lemmatization (added stop-words recognizing with pymorphy2).
- Implemented and integrated class PathService.
- Improved classification accuracy and updated tests results.
Pre-release v5.0.2-pa.479
- Test vector model and add testing results.
- Add fast-test mode for fast functionality checking (50 tests).
- Update test-reports.
- Delete decision tree (reports and models).
- Fix bugs in NgramAnalyzer (empty synonyms and synonyms with incorrect ngram-type).
- Vector model and databases published on yandex disk, add existing check and automatic download.
Release 5.0.1
Лицензия проекта изменена на Apache 2.0.
Копия лицензии: http://www.apache.org/licenses/LICENSE-2.0
License changed to Apache 2.0.
Copy of this license: http://www.apache.org/licenses/LICENSE-2.0
Text Tonal Analyser
Изменения:
- Добавлен анализ триграмм текста.
- Добавлена база данных, содержащая все триграммы из обучающей выборки.
- Из баз данных удалены повторяющиеся N-граммы.
- Модуль lemmatizaion заменен на сервис Lemmatizer.
- Модуль get_ngram_info заменен на сервис DatabaseCursor.
- Модуль voice заменен на сервис SpeechRecognizer.
- Модуль count_text_tonal заменен на сервисы TextWeightCounter и Classifier.
- Создан сервис FileReader, реализующий чтение данных из файла.
- Создан сервис NgramAnalyzer для поиска синонимов N-граммы с помощью векторной модели.
- Создан сервис SpellChecker для проверки орфографии в исходном тексте.
- Реализовано гибкое логгирование (сервис Logger), поддерживающее разные виды сообщений (debug, info, warning, error, fatal).
- Классификатор изменен на Наивный Байесовский Классификатор (sklearn.naive_bayes.GaussianNB).
- Обновлена документация и README, добавлен файл requirements.txt со списком всех используемых сторонних библиотек для их быстрой установки.
- Обновлены модели классификатора.
- Обновлены версии сторонних библиотек и интерпретатора.
- Добавлены результаты тестирования разных классификаторов.
- Повышена безопасность (исправлены баги при работе с векторной моделью, приводящие к фатальным ошибкам).
Программа для анализа тональности текста
В данном релизе представлены следующие обновления:
- Алгоритм классификации изменен на логистическую регрессию
- Создано и записано три базы данных (содержащие информацию о количестве документов, в которые входит данная N-грамма)
- Изменен графический интерфейс (добавлена возможность голосового ввода и вывод вероятности принадлежности объекта к данному классу)
- Удалены лишние модули и файлы, проведен рефакторинг кода
- В использование введен класс Document, содержащий все функции для обработки документа и его классификации
- Добавлена проверка орфографии в модуль лемматизации
- Оптимизирован модуль get_ngram_info (получение информации из базы данных), в эксплуатацию введено использование векторной модели для поиска ближайших синонимов N-граммы
- Реализовано разбиение документа на биграммы и учет веса по биграммам при классификации
- Проведено системное тестирование и исправлены баги
- Повышена стабильность работы программы
- Добавлена документация по каждому модулю программы
Программа определения тональности слов
В данном релизе оптимизирована работа программы и добавлена первая версия графического интерфейса.
Система определения тональности текста
В данном релизу оптимизирован алгоритм классификации текста.
Система определения тональности текста
Добавлена функция классификации текста. Добавлена лицензия и Copyright.
Добавлено 45 000 позитивных и 53 000 негативных документов. Оптимизирована работа с базами данных.