Skip to content

OpenNLP models for Russian language based on news feeds.

Notifications You must be signed in to change notification settings

livelace/opennlp-models

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 

Repository files navigation

Автоматически обновляемые модели OpenNLP для русского языка.

Модели созданы на общедоступном материале новостных агентств:

  1. Ведомости
  2. ИА REGNUM
  3. Известия
  4. Интерфакс
  5. РИА Новости
  6. ТАСС

Сбор данных осуществляется при помощи: gosquito
Разметка тегов осуществляется при помощи: digator-opennlp + digator-label-studio

Быстрый старт:

Отображение справки:

user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4
This container intended for quick evaluation of OpenNLP models for Russian language whose based on various news feeds.

For more details see: https://github.com/livelace/opennlp-models

Usage:

--type news. Model type.
--lang ru. Model language.
--entity all|date|event|fac|gpe|loc|money|org|per|time. Entity type.

Named entities recognition mode:

docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all

... write sentences

Распознавание именованных сущностей:

user@localhost ~ $ docker run -ti --rm ghcr.io/livelace/opennlp-models:1.8.4 --type news --lang ru --entity all
INFO: Type here: 
Loading Token Name Finder model ... done (0.312s)
Приговор Марии Бутиной имеет антиправовой характер, он доказывает, что США ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил РИА Новости председатель комитета Совета Федерации по конституционному законодательству Андрей Клишас.
Приговор <START:PER> Марии Бутиной <END> имеет антиправовой характер, он доказывает, что <START:GPE> США <END> ради геополитических интересов готовы нарушать фундаментальные принципы построения своей правовой системы, заявил <START:ORG> РИА Новости <END> председатель комитета <START:ORG> Совета Федерации <END> по конституционному законодательству <START:PER> Андрей Клишас. <END>

About

OpenNLP models for Russian language based on news feeds.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages