Recognizing Named Entities in Specific Domainстатья
Статья опубликована в журнале из списка RSCI Web of Science
Информация о цитировании статьи получена из
Web of Science,
Scopus
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 11 ноября 2020 г.
Аннотация:The paper presents the results of applying the BERT representation model in thenamed entity recognition task (NER) for the cybersecurity domain in Russian. We compare severalapproaches to domain-specific NER combining BERTfine-tuning on a domain-specifictextcol-lection, general labeled data, domain-specific data augmentation, and a domain-specific annotateddataset. We showed that using a BERT modelfine-tuned on a domain text collection and pre-trained on the combination of a general dataset and augmented data achieves the best results ofnamed entity recognition. We also studied computational performance of the BERT model in so-called mixed precision regime.