Skip to content

Latest commit

 

History

History
49 lines (33 loc) · 2.82 KB

README.md

File metadata and controls

49 lines (33 loc) · 2.82 KB

Автоматически обновляемые модели OpenNLP для русского языка.

Модели созданы на общедоступном материале новостных агентств:

  1. Ведомости
  2. ИА REGNUM
  3. Известия
  4. Интерфакс
  5. РИА Новости
  6. ТАСС

Сбор данных осуществляется при помощи: gosquito
Разметка тегов осуществляется при помощи: digator-opennlp + digator-label-studio

Быстрый старт:

Отображение справки:

user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4
This container intended for quick evaluation of OpenNLP models for Russian language whose based on various news feeds.

For more details see: https://github.com/livelace/opennlp-models

Usage:

--type news. Model type.
--lang ru. Model language.
--entity all|date|event|fac|gpe|loc|money|org|per|time. Entity type.

Named entities recognition mode:

docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all

... write sentences

Распознавание именованных сущностей:

user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all
INFO: Type here: 
Loading Token Name Finder model ... done (0.312s)
Приговор Марии Бутиной имеет антиправовой характер, он доказывает, что США ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил РИА Новости председатель комитета Совета Федерации по конституционному законодательству Андрей Клишас.
Приговор <START:PER> Марии Бутиной <END> имеет антиправовой характер, он доказывает, что <START:GPE> США <END> ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил <START:ORG> РИА Новости <END> председатель комитета <START:ORG> Совета Федерации <END> по конституционному законодательству <START:PER> Андрей Клишас. <END>