Аннотация:В этой статье описывается NEREL — набор данных российских новостей, подходящий для трех задач: распознавание вложенных именованных объектов, извлечение отношений и связывание сущностей с базой знаний. По сравнению с плоскими сущностями, вложенные именованные сущности предоставляют более богатую и полную аннотацию, а также расширяют охват аннотаций отношений и связывания сущностей. Отношения между вложенными именованными сущностями могут пересекать границы сущностей и соединяться с более короткими сущностями, вложенными в более длинные, что затрудняет обнаружение таких отношений. NEREL в настоящее время является крупнейшим российским набором данных, аннотированным сущностями и отношениями: он включает 29 именованных типов сущностей и 49 типов отношений. На момент написания набор данных содержал 56 тысяч именованных сущностей и 39 тысяч отношений, аннотированных в 933 личностно-ориентированных новостных статьях. NEREL аннотирован отношениями на трех уровнях: (1) внутри вложенных именованных сущностей, (2) внутри предложений и (3) с отношениями, пересекающими границы предложений. Мы обеспечиваем сравнительную оценку современных современных методов по всем трем задачам.