Элина тихонова википедия: Элина Тихонова – Информационно-аналитическая система Росконгресс

Автор: | 11.11.2020

Содержание

Элина Тихонова, Москва, Россия — полная информация о человеке из профиля (id13281343) в социальных сетях

Информации о личной жизни Элины не найдено

Пользователь решил не оставлять личного статуса на своей страничке.

Фотографии

Можно листать свайпом, увеличивать по клику

    Основная информация о Тихоновой Элине

    Основная информация о её VK профиле

    • Галочка верификации

      Отсутствует

    • Дата регистрации профиля ВКонтакте

      16 мая 2008 года

    • Прошло после регистрации

      14 лет 9 месяцев 21 день

    • Онлайн ли сейчас

      Нет

    • Когда была онлайн

      09 марта 2023 в 01:05:07

    • С какого устройства заходила

      Через приложение для iPhone

    • ID профиля

      13281343

    • Никнейм (псевдоним)

      Короткий адрес страницы (домен, никнейм) не задан

    Настройки приватности страницы Элины

    • Можно ли отправить личное сообщение?

      Такая возможность есть

    • Разрешены ли записи на стене?

      Запрещены

    • Статус профиля VK

      Открытый

    • Доступ к аудиозаписям

      Открыт

    Наполнение страницы

    • Сколько подписчиков

      228

    • Сколько друзей

      1006

    • Подарки

      11

    • Заметки

      Нет данных

    • Фотоальбомы

      1

    • Фотографии

      4

    • Видеозаписи

      11

    • Аудиозаписи

      4

    • Группы

      Скрыто

    • Паблики

      12

    Где училась и работала

    • Школа

      Информация не указана или скрыта настройками приватности

    • ВУЗ

      Информация не указана или скрыта настройками приватности

    • Работа

      Информация не указана или скрыта настройками приватности

    Хобби, интересы, увлечения

    • Деятельность

      Не указано или скрыто

    • Интересы

      Не указано или скрыто

    • Любимая музыка

      Не указано или скрыто

    • Любимые фильмы

      Не указано или скрыто

    • Любимые книги

      Не указано или скрыто

    • Любимые игры

      Не указано или скрыто

    • Любимые TV-шоу

      Скрыто или не указано

    • Любимые цитаты

      Не указано или скрыто

    • О себе

      Информация скрыта или не указана

    Жизненная позиция

    • Главным в жизни считает

      Скрыто или не заполнено

    • Главным в людях считает

      Скрыто или не заполнено

    • Политические предпочтения

      Скрыто или не заполнено

    • Источники вдохновения

      Скрыто или не заполнено

    • Мировоззрение

      Скрыто или не заполнено

    • Как относится к алкоголю

      Скрыто или не заполнено

    • Как относится к курению

      Скрыто или не заполнено

    Список друзей

    К сожалению, не удаётся получить список друзей Элины.
    Если статус профиля VK значится как «закрытый», это вполне нормально.
    В противном случае попробуйте обновить данную страницу, иногда это помогает

    .

    Удалить страницу

    Если Вы являетесь владельцем этого vk профиля id13281343, можете легко его удалить с сайта profiles-vkontakte.ru, вся информация с этой страницы исчезнет, будто её тут и не было никогда. И гарантированно не появится тут снова.

    Для удаления придётся кое-что сделать, чтобы алгоритм мог Вас идентифицировать, как владельца профиля. Ничего сложного и трудоёмкого: просто в качестве своего статуса ВКонтакте (именно на страничке где id 13281343) напишите pvkontakte123, без всяких пробелов и других символов, после чего нажмите кнопку «УДАЛИТЬ ПРОФИЛЬ».

    Так система поймёт, что Вы — это действительно Вы, после чего произойдёт удаление, полностью в автоматическом режиме. Разумеется, после успешного удаления можно удалить статус pvkontakte123, поменять его, делать с ним всё что угодно — идентификация более не требуется.

    А теперь ещё раз, коротко:

    1. Устанавливаете статус pvkontakte123
    2. Нажимаете кнопку УДАЛИТЬ ПРОФИЛЬ
    3. Вся публичная информация из vk о вас удаляется с profiles-vkontakte.ru навсегда.

    Удалить профиль

    Страница сформирована в реальном времени на основе API-ответа от ВКонтакте, содержащего только открытые данные профиля vk.com/id13281343, которые НЕ были скрыты настройками приватности. Сайт profiles-vkontakte.ru НЕ собирает и НЕ хранит данные пользователей ВКонтакте.

    Предупреждаем о том, что проекты компании Meta (Facebook, Instagram), как и она сама, признаны на территории Российской Федерации террористическими и экстремистскими, соответственно, запрещёнными.

    Элина Аванесян — imag.one — последние новости, фото, биография

    10.01 / 12:31

    Андреева, Тихонова, Шнайдер, Кудерметова, Селехметьева вышли в 1/2 квалификации на AO

    Российские теннисистки Эрика Андреева, Полина Кудерметова, Анастасия Тихонова, Элина Аванесян, Диана Шнайдер и Оксана Селехметьева вышли в полуфинал квалификации на грядущий Australian Open.

    Эрика Андреева в полуфинале сыграет с украинкой Катариной Заватской, Полина Кудерметова встретится с британкой Кэти Бултье, Анастасия Тихонова сразится с корейкой На Ли Хан, Оксана Селехметьева встретится с американкой Анн Ли, Диана Шнайдер поборется с американкой Робин Монтгомери, Элина Аванесян сразится с американйо Софи Чанг.

    17.10 / 20:47

    спортсемья Россиянка Элина Аванесян проиграла Виктории Азаренко в первом круге турнира в Гвадалахаре

    130-я ракетка мира российская теннисистка Элина Аванесян не сумела пробиться во второй круг турнира категории WTA-1000 в Гвадалахаре (Мексика). Аванесян попала в основную сетку в качестве лаки-лузера. В мате первого раунда Аванесян (LL) проиграла двукратной чемпионке турниров «Большого шлема», бывшей первой ракетке мира белоруске Виктории Азаренко со счётом 4:6, 2:6.

    17.10 / 20:01

    спорт Элина Аванесян стала лаки-лузером на турнире в Мексике, став седьмой россиянкой в сетке

    Российская теннисистка Элина Аванесян (130-я в рейтинге WTA) в последний момент стала участницей хардового турнира категории WTA-1000 в Гвадалахаре (Мексика), как лаки-лузер, заменив китаянку Чжан Шуай. Россиянка в первом круге играет с белорусской теннисисткой Викторией Азаренко (37-я в рейтинге WTA).

    10.10 / 18:14

    10.10 / 18:00

    спорт Россиянка Элина Аванесян не сумела пробиться во второй круг турнира WTA-250 в Клуж-Напоке

    129-я ракетка мира, 20-летняя российская теннисистка Элина Аванесян не сумела пробиться во второй круг турнира категории WTA-250 в Клуж-Напоке (Румыния). В матче первого круга квалифаер Аванесян уступила 62-й ракетке мира Анне Бондарь (8) из Венгрии со счётом 4:6, 2:6. Встреча продлилась 1 час 16 минут.

    10.10 / 16:35

    связьспорт Крейчикова снялась с турнира в Клуж-Напоке из-за травмы

    Чешская теннисистка Барбора Крейчикова приняла решение сняться с турнира категории WTA-250 в Клуж-Напоке (Румыния) в связи с травмой левого запястья. На соревнованиях она имела первый номер посева.

    09.10 / 17:57

    спортконфликтдети и родители Захарова, Аванесян, Блинкова, Рахимова успешно прошли квалификацию на турнир в Клуж-Напоке

    Российские теннисистки Анастасия Захарова (179-я в рейтинге WTA), Элина Аванесян (126-я в рейтинге WTA), Камилла Рахимова (123-я в рейтинге WTA), Анна Блинкова (137-я в рейтинге WTA) успешно прошли квалификацию на турнир в Клуж-Напоке (Румыния).

    Анна Захарова во втором круге квалификации обыграла румынку Александру Игнатик со счётом 6:4, 6:1.

    09.10 / 16:07

    спорт Аванесян и Захарова одержали уверенные победы в финале квалификации турнира в Клуж-Напоке

    20-летние российские теннисистки Элина Аванесян и Анастасия Захарова пробились в основную сетку турнира категории WTA-250 в Клуж-Напоке (Румыния). 126-я ракетка мира Аванесян в финале квалификации уверенно обыграла немку Тамару Корпач (98-й номер рейтинга) со счётом 6:4, 7:5.

    30.08 / 03:41

    спортобществочемпионат Россиянка Аванесян проиграла в первом круге US Open

    Российская теннисистка Элина Аванесян не смогла преодолеть барьер первого круга Открытого чемпионата США. На старте турнира она уступила представительнице Сербии Александре Крунич со счётом 4:6, 4:6. Продолжительность встречи составила 1 час 22 минуты.

    29.08 / 13:05

    спорттеннисчемпионат US Open – 2022, женщины: расписание и примерное время начала матчей 1-го игрового дня

    Сегодня, 29 августа, стартует Открытый чемпионат США по теннису. В борьбу вступит, в частности, первая ракетка России Дарья Касаткина и другие российские теннисистки.Предлагаем вашему вниманию примерное время начала основных матчей первого игрового дня в женском одиночном разряде.

    28.08 / 15:39

    спорт US Open – 2022, женщины: расписание матчей 1-го круга, турнирная сетка

    29 августа в Нью-Йорке стартует US Open – 2022. Соревнования продлятся до 10 августа, их действующей чемпионкой является 19-летняя британка, 11-я ракетка мира Эмма Радукану. «Чемпионат» представляет матчи россиянок в первом круге US Open – 2022: Ребекка Петтерсон (Швеция) – Анна Калинская (Россия) – 29 августа (18:00 мск) – корт №14.

    22.08 / 22:21

    22.07 / 00:59

    спортобщество Аванесян не смогла выйти в четвертьфинал турнира в Палермо

    Российская теннисистка Элина Аванесян завершила выступление на турнире WTA-250 в Палермо (Италия). В матче второго круга 129-я ракетка мира уступила итальянке Лючии Бронцетти. Встреча закончилась со счётом 1:6, 3:6.

    20.07 / 00:49

    спорт Аванесян вышла во второй круг турнира в Палермо

    Российская теннисистка Элина Аванесян вышла во второй круг турнира WTA-250 в Палермо (Италия). 129-я ракетка мира на старте турнира обыграла бразильянку Каролину Алвес. Встреча закончилась со счётом 6:2, 5:7, 6:1.

    08.04 / 22:47

    спортобщество Россиянка Аванесян уступила 33-й ракетке мира Осорио-Серрано на турнире WTA-250 в Боготе

    170-я ракетка мира российская теннисистка Элина Аванесян уступила Марии-Камиле Осорио-Серрано в четвертьфинале турнира категории WTA-250 в Боготе (Колумбия). Матч завершился победой 33-й ракетки мира из Колумбии в двух сетах со счётом 6:1, 6:4. Отметим, что Осорио-Серрано — первая сеяная теннисистка текущего турнира.

    08.04 / 20:51

    спорт Украинская теннисистка Ястремская не смогла пробиться в полуфинал турнира WTA-250 в Боготе

    102-я ракетка мира, украинская теннисистка Даяна Ястремская уступила Лауре Пигосси в четвертьфинале турнира категории WTA-250 в Боготе (Колумбия). Матч завершился победой 212-й ракетки мира из Бразилии в трёх сетах со счётом 6:2, 4:6, 7:6 (7:3). Отметим, что ранее на текущем турнире Ястремская обыграла четвёртую сеяную, представительницу Венгрии Панну Удварди и итальянку Сару Эррани.

    06.04 / 22:35

    спорткурс 19-летняя Элина Аванесян разгромила соперницу и вышла в четвертьфинал турнира в Боготе

    19-летняя российская теннисистка Элина Аванесян уверенно вышла в четвертьфинал грунтового турнира категории WTA-250 в Боготе (Колумбия), который продлится до 10 апреля. Во втором круге соревнований Аванесян разгромила представительницу Италии Лукрецию Стефанини со счётом 6:2, 6:2. Продолжительность матча составила 1 час 22 минуты.

    05.04 / 21:10

    спорт 19-летняя Элина Аванесян с разгромной победы стартовала на турнире в Боготе

    19-летняя российская теннисистка Элина Аванесян уверенно вышла во второй круг грунтового турнира категории WTA-250 в Боготе (Колумбия), который продлится до 10 апреля. На старте соревнований Аванесян обыграла восьмую сеяную британку Хэрриет Дарт со счётом 6:1, 6:2. Продолжительность матча составила 1 час 19 минут.

    15.01 / 20:57

    14.01 / 14:26

    14.01 / 10:10

    13.01 / 09:29

    13.01 / 09:07

    общество Аванесян одолела Козлову и сыграет в финале квалификации Australian Open

    Российская теннисистка Элина Аванесян обыграла представительницу Украины Катерину Козлову и вышла в финал квалификации Australian Open.Встреча продолжалась один час 29 минут и завершилась со счетом 6:2, 7:5 в пользу россиянки.Аванесян совершила одну подачу навылет, три двойные ошибки и реализовала восемь брейк-пойнтов из 12.На счету ее соперницы также один эйс, одна двойная ошибка и пять реализованных брейка из 13.В финале Аванесян сыграет против еще одной украинки Леси Цуренко.источник: «Советский спорт»

    13.01 / 06:34

    спортобществочемпионат Элина Аванесян обыграла украинку и вышла в финал квалификации Australian Open

    Российская теннисистка Элина Аванесян вышла в финал квалификации Открытого чемпионата Австралии 2022 года, который пройдёт в Мельбурне с 17 по 30 января. В ночь на четверг по московскому времени в матче второго круга квалификационного турнира Аванесян, занимающая 214-е место в рейтинге WTA, обыграла представительницу Украины Катерину Байндль (в девичестве Козлову, занимающую 144-е место в мировой классификации).

    Ведущий российских новостей ошеломляет гостей-экономистов и произносит тосты за смерть фондового рынка в прямом эфире

    Многое из того, что показывают по телевидению в России, тщательно контролируется государством… но не все.

    Ведущий новостей РБК едва смог скрыть свое удивление в среду, когда гость-экономист совершенно не по сценарию — и буквально смертельный тост российского фондового рынка.

    Эксперт Александр Бутманов был приглашен в прямую трансляцию на популярном канале деловых новостей, возможно, с невероятной задачей — приукрасить негативные санкции, введенные против России в ответ на вторжение в Украину.

    инстаграм

    Максим Чмерковский Подробности «Болезненного» побега с Украины, который он совершает в Польше

    см. в сюжете

    Нет.

    «Сегодня с нами в студии Александр Батаманов, основатель инвестиционного клуба «Элиз», специалист по фондовому рынку», — представила ведущая Элина Тихонова, согласно переводу Вышеграда. «Александр, привет».

    — Здравствуйте, — со стоическим лицом ответил Бутманов. — Я бы не сказал «ачче дин».

    — Да никто сейчас и не говорит, — согласилась Тихонова, до того, устаревает ли фондовый рынок, и собирается ли он вообще остаться в отрасли.

    «В худшем случае я буду играть роль Санта-Клауса, как и 25 лет назад», — ответил он.

    Эксперт по российскому фондовому рынку Александр Бутманов был приглашен российским телевидением, чтобы рассказать о российском фондовом рынке после санкций.

    Все пошло не по плану.

    Он сказал, что он испорчен и ему снова придется работать Санта-Клаусом

    Перевод в комментариях ️pic.twitter.com/bvQy7Dbq2n

    — visegrad24 (@visegrad24) 3 марта 2022 г.
    @wisegrade24

    «Ну, такое бывает только раз в году… Тихонова профессионально обкатывает ложью – но Бутманов не шутил.

    «Шутки в сторону, позвольте мне сделать это быстро: передаю привет Сергею Усиченко, который пил до смерти фондового рынка 12, 13 лет назад», — сказал он, вытаскивая бутылку, с широко раскрытыми глазами потрясенная тишина. Из безмолвного хозяина попросил.

    «Сегодня я пью газировку. Дорогой фондовый рынок – ты был нам близок, нам интересен. Успокойся, дорогой товарищ. И он сделал глоток.

    Гетти/Твиттер

    Лия Ремини обращается к бывшему партнеру DWTS в твиттере «Максим Украина» после избиения Кирсти Элли

    см. историю

    По сообщению российского новостного агрегатора, Тихонова, оправившись от своей глупости, поспешно завершила недолговечный отрезок словами: «Она никак не будет комментировать этот флешмоб». тизернал,

    За семь дней с тех пор, как президент России Владимир Путин начал почти повсеместно предосудительную атаку на своего соседа, стоимость рубля упала, поскольку страна борется со все более удушающими экономическими санкциями.

    Российские банки отключены от системы SWIFT, что не позволяет им вести бизнес за пределами страны; Зарубежные активы, принадлежащие олигархам, были заморожены, а Германия приостановила свой проект газопровода «Северный поток-2» стоимостью 11 миллиардов долларов.

    Несколько мировых компаний либо ушли из страны, либо прекратили экспорт туда, в том числе энергетические гиганты, BP и Shell, Exxon; производители транспортных средств, такие как Ford, General Motors, Volkswagen, Boeing и Airbus; и гиганты розничной торговли, такие как IKEA и H&M.

    Disney, WarnerMedia, YouTube, Netflix, Spotify и DirecTV прекратили распространение контента там, а Facebook и Twitter пообещали блокировать контент государственных СМИ. Mastercard и Visa также заблокировали финансовые учреждения.

    ютуб

    Джой Бехар опасается, что вторжение России в Украину может повлиять на ее отпуск в Италии, пишет в Twitter

    см. историю

    Источник

    Екатерина Артемова — Антология ACL

    2022

    pdf нагрудник abs
    RuCoLA: Корпус лингвистической приемлемости русского языка
    Владислав Михайлов | Татьяна Шамардина | Макс Рябинин | Алена Пестова | Иван Смуров | Екатерина Артемова
    Материалы конференции 2022 года по эмпирическим методам обработки естественного языка

    Лингвистическая приемлемость (LA) привлекает внимание исследовательского сообщества из-за его многочисленных применений, таких как проверка грамматических знаний языковых моделей и фильтрация неправдоподобных текстов с помощью классификаторов приемлемости. Однако область применения LA на языках, отличных от английского, ограничена из-за отсутствия качественных ресурсов. бинарный LA-подход. RuCoLA состоит из 90,8 тыс. предложений в предметной области из лингвистических публикаций и 3,6 тыс. предложений вне домена, созданных генеративными моделями. Набор вне предметной области создан для облегчения практического использования приемлемости для улучшения генерации языка. В нашей статье описывается протокол сбора данных и представлен подробный анализ экспериментов по классификации приемлемости с использованием ряда базовых подходов. В частности, мы демонстрируют, что наиболее широко используемые языковые модели по-прежнему сильно отстают от человеческих, особенно при обнаружении морфологических и семантических ошибок. Мы выпускаем RuCoLA, код экспериментов и общедоступную таблицу лидеров для оценки лингвистической компетентности языковых моделей для русского языка.

    pdf нагрудник abs
    Суждения о приемлемости через изучение топологии карт внимания
    Даниил Чернявский | Эдуард Тульчинский | Владислав Михайлов | Ирина Проскурина | Лаида Кушнарёва | Екатерина Артемова | Сергей Баранников | Ирина Пионтковская | Дмитрий Пионтковский | Евгений Бурнаев
    Выводы Ассоциации компьютерной лингвистики: EMNLP 2022

    Особый интерес в НЛП вызывает роль механизма внимания в кодировании лингвистических знаний. Однако способность головок внимания судить о грамматической приемлемости предложения недостаточно изучена. Эта статья приближается к парадигме суждений о приемлемости с помощью топологического анализа данных (TDA), показывая, что геометрические свойства графа внимания могут быть эффективно использованы для двух стандартных практик в лингвистике: бинарных суждений и лингвистических минимальных пар. Топологические особенности улучшают оценки классификатора приемлемости на основе BERT на 8–24 % в CoLA на трех языках (английском, итальянском и шведском). Выявив топологическое несоответствие между картами внимания минимальных пар, мы достигли производительности человеческого уровня в тесте BLiMP, превзойдя девять статистических и базовых показателей Transformer LM. В то же время TDA обеспечивает основу для анализа языковых функций головок внимания и интерпретации соответствия между признаками графа и грамматическими явлениями. Мы публично публикуем код и другие материалы, использованные в экспериментах.

    pdf нагрудник abs
    ЛЕНТА: Оценка уровня понимания русского языка
    Екатерина Такташева | Татьяна Шаврина | Алена Феногенова | Денис Шевелев | Надежда Катричева | Мария Тихонова | Альбина Ахметгареева | Олег Зинкевич | Анастасия Башмакова | Светлана Иорданская | Алена Спиридонова | Валентина Куренщикова | Екатерина Артемова | Владислав Михайлов
    Выводы Ассоциации компьютерной лингвистики: EMNLP 2022

    Недавние достижения в обучении с нулевым и малым числом выстрелов продемонстрировали многообещающие результаты для целого ряда исследовательских и практических целей. Однако в этой быстрорастущей области отсутствуют стандартизированные наборы средств оценки для языков, отличных от английского, что препятствует прогрессу за пределами англоцентричной парадигмы. Для этого направления исследований мы предлагаем TAPE (оценка текстовых атак и возмущений), новый тест, который включает в себя шесть более сложных задач NLU для русского языка, охватывающих рассуждения с несколькими переходами, этические концепции, логику и здравый смысл. Дизайн TAPE фокусируется на систематической нулевой и малой оценке NLU: (i) лингвистически ориентированные состязательные атаки и возмущения для анализа надежности и (ii) подгруппы для тонкой интерпретации. Подробный анализ тестирования авторегрессионных базовых показателей показывает, что простые возмущения, основанные на правописании, больше всего влияют на производительность, в то время как перефразирование входных данных оказывает более незначительное влияние. В то же время результаты демонстрируют значительный разрыв между нейронными и человеческими базовыми уровнями для большинства задач. Мы публично выпускаем TAPE (https://tape-benchmark.com), чтобы стимулировать исследования надежных LM, которые могут обобщаться для новых задач, когда практически отсутствует контроль.

    pdf нагрудный номер
    Труды NLP Power! Первый семинар по эффективному бенчмаркингу в НЛП
    Татьяна Шаврина | Владислав Михайлов | Валентин Малых | Екатерина Артемова | Олег Сериков | Виталий Протасов
    Труды НЛП Сила! Первый семинар по эффективному бенчмаркингу в НЛП

    pdf нагрудник abs
    Контролируемая и неконтролируемая оценка синтетического переключения кода
    Евгений Орлов | Екатерина Артемова
    Материалы восьмого семинара по зашумленному пользовательскому тексту (W-NUT 2022)

    Переключение кода (CS) — это явление смешения слов и фраз из нескольких языков в одном предложении или разговоре. Постоянно растущее количество общения CS между говорящими на нескольких языках в социальных сетях выдвинуло на первый план необходимость адаптации существующих продуктов NLP для носителей CS и привело к растущему интересу к решению задач CS NLP. Большое количество современных подходов используют синтетические данные CS для обучения. Поскольку предыдущая работа показала положительный эффект предварительного обучения на высококачественных данных CS, задача оценки синтетического CS становится решающей. В этой статье мы решаем задачу оценки синтетических CS в двух условиях. В контролируемых условиях мы применяем точные модели Hinglish для решения задачи прогнозирования рейтинга качества конкурса HinglishEval и создания новой SOTA. В неконтролируемых условиях мы используем метод мер приемлемости с теми же моделями. Мы обнаружили, что в обоих случаях модели, настроенные на данных CS, неизменно превосходят свои оригинальные аналоги.

    pdf нагрудник abs
    Размечено: Распознавание именных сущностей из электронного архива дневников «Прожито»
    Тимофей Атнашев | Вероника Ганеева | Роман Казаков | Дарья Матяш | Майкл Сонкин | Екатерина Волошина | Олег Сериков | Екатерина Артемова
    Материалы 5-й Международной конференции по компьютерной лингвистике в Болгарии (CLIB 2022)

    Подавляющее большинство существующих наборов данных для распознавания именованных объектов (NER) основаны в основном на новостях, научных работах и ​​Википедии, за некоторыми исключениями, созданными из исторические и литературные тексты. Более того, английский язык является основным источником данных для дальнейшей маркировки. Эта статья призвана заполнить многочисленные пробелы путем создания нового набора данных «Размечено», собранного из дневниковых текстов проекта «Прожито» на русском языке. Наш набор данных представляет интерес для нескольких направлений исследований: литературные исследования текстов дневников, трансфертное обучение из других областей, распознавание малоресурсных или межъязыковых именованных объектов. Размечено состоит из 1331 предложений и 14119жетоны, взятые из дневников, написанных в годы перестройки. Схема аннотации состоит из пяти часто используемых тегов сущностей: лицо, характеристики, местоположение, организация и объект. Маркировка осуществляется на краудсорсинговой платформе Яндекс.Толока в два этапа. Сначала рабочие отбирали предложения, содержащие сущность определенного типа. Во-вторых, они разметили интервалы сущностей. В результате было получено 1113 объектов. Эмпирическая оценка Размечено проводится с помощью готовых инструментов NER и тонкой настройки предварительно обученных контекстуализированных кодировщиков. Мы публикуем аннотированный набор данных для открытого доступа.

    2021

    pdf нагрудник abs
    Активное обучение для маркировки последовательностей с помощью предварительно обученных моделей и байесовских оценок неопределенности
    Артем Шелманов | Дмитрий Пузырев | Любовь Куприянова | Денис Беляков | Даниил Ларионов | Никита Хромов | Ольга Козлова | Екатерина Артемова | Дмитрий В. Дылов | Александр Панченко
    Материалы 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: Основной том

    Аннотирование обучающих данных для разметки последовательностей текстов обычно занимает очень много времени. Последние достижения в области трансферного обучения для обработки естественного языка в сочетании с активным обучением открывают возможность значительно сократить необходимый бюджет аннотаций. Мы первые, кто тщательно исследовал эту мощную комбинацию для задачи маркировки последовательностей. Мы проводим обширное эмпирическое исследование различных байесовских методов оценки неопределенности и вариантов отсева Монте-Карло для моделей с глубоким предварительным обучением в среде активного обучения и находим лучшие комбинации для разных типов моделей. Кроме того, мы также демонстрируем, что для получения экземпляров во время активного обучения полноразмерный Transformer можно заменить дистиллированной версией, которая обеспечивает лучшую вычислительную производительность и уменьшает препятствия для применения глубокого активного обучения на практике.

    pdf нагрудник abs
    Один пример может улучшить генерацию данных Zero Shot
    Павел Бурнышев | Валентин Малых | Андрей Бут | Екатерина Артемова | Ирина Пионтковская
    Материалы 14-й Международной конференции по генерации естественного языка

    Подзадачи классификации по намерениям, такие как устойчивость к сдвигу распределения, адаптация к конкретным группам пользователей и персонализация, обнаружение вне предметной области, требуют обширных и гибких наборов данных для эксперименты и оценки. Поскольку сбор таких наборов данных занимает много времени и сил, мы предлагаем использовать методы генерации текста для сбора наборов данных. Генератор должен быть обучен генерировать высказывания, соответствующие заданному намерению. Мы исследуем два подхода к генерации высказываний, ориентированных на задачу: в нулевом подходе модель обучается генерировать высказывания из видимых намерений и в дальнейшем используется для создания высказываний для намерений, невидимых во время обучения. В однократном подходе модель представлена ​​одним высказыванием из намерения теста. Мы проводим тщательную автоматическую и человеческую оценку внутренних свойств двухпоколенческих подходов. Атрибуты сгенерированных данных близки к оригинальным тестовым наборам, собранным с помощью краудсорсинга.

    pdf нагрудник abs
    NEREL: русский набор данных с вложенными именованными сущностями, отношениями и событиями
    Наталья Лукашевич | Екатерина Артемова | Татьяна Батура | Павел Браславский | Илья Денисов | Владимир Иванов | Суреш Манандхар | Александр Пугачев | Елена Тутубалина
    Материалы Международной конференции по последним достижениям в области обработки естественного языка (RANLP 2021)

    В этой статье мы представляем NEREL, российский набор данных для распознавания именованных сущностей и извлечения отношений. NEREL значительно больше существующих российских наборов данных: на сегодняшний день он содержит 56 тыс. аннотированных именованных объектов и 39K аннотированные отношения. Его важным отличием от предыдущих наборов данных является аннотация вложенных именованных сущностей, а также отношений внутри вложенных сущностей и на уровне дискурса. NEREL может облегчить разработку новых моделей, которые могут извлекать отношения между вложенными именованными сущностями, а также отношения как на уровне предложений, так и на уровне документов. NEREL также содержит аннотацию событий с участием именованных объектов и их ролей в событиях. Коллекция NEREL доступна через https://github.com/nerel-ds/NEREL.

    pdf нагрудник abs
    Morph Call: исследование морфосинтаксического содержания многоязычных трансформеров
    Владислав Михайлов | Олег Сериков | Екатерина Артемова
    Материалы Третьего семинара по вычислительной типологии и многоязычному НЛП

    Выдающаяся производительность языковых моделей на основе преобразователей в большом количестве задач НЛП и НЛУ стимулировала интерес к изучению их внутренней работы. Недавние исследования были в основном сосредоточены на более сложных и сложных лингвистических явлениях, таких как синтаксис, семантика, мировоззрение и здравый смысл. Большинство исследований носит англоцентрический характер, и мало что известно о других языках, особенно об их морфосинтаксических свойствах. С этой целью в нашей работе представлен Morph Call — набор из 46 тестовых заданий для четырех индоевропейских языков разной морфологии: русского, французского, английского и немецкого. Мы предлагаем новый тип задач на зондирование, основанный на выявлении управляемых возмущений предложений. Мы используем комбинацию методов интроспекции на уровне нейронов, слоев и репрезентации для анализа морфосинтаксического содержания четырех многоязычных трансформеров, включая их малоизученные дистиллированные версии. Кроме того, мы исследуем, как тонкая настройка задачи POS-маркировки влияет на производительность зондирования.

    pdf нагрудник abs
    RuSentEval: Лингвистический источник, Encoder Force!
    Владислав Михайлов | Екатерина Такташева | Элина Сигдель | Екатерина Артемова
    Материалы 8-го семинара по балто-славянской обработке естественного языка

    Успех предварительно обученных языковых моделей-трансформеров вызвал большой интерес к тому, как эти модели работают и что они узнают о языке. Однако предыдущие исследования в этой области в основном посвящены английскому языку, и мало что известно о других языках. С этой целью мы представляем RuSentEval, расширенный набор из 14 тестовых заданий для русского языка, в том числе еще не изученных. Мы применяем комбинацию дополнительных методов зондирования для изучения распределения различных языковых свойств в пяти многоязычных трансформерах для двух типологически контрастных языков — русского и английского. Наши результаты дают интригующие выводы, которые противоречат общепринятому пониманию того, как представляются лингвистические знания, и демонстрируют, что некоторые свойства усваиваются сходным образом, несмотря на языковые различия.

    pdf нагрудник абс
    Обнаружение искусственного текста с помощью изучения топологии карт внимания
    Лаида Кушнарева | Даниил Чернявский | Владислав Михайлов | Екатерина Артемова | Сергей Баранников | Александр Бернштейн | Ирина Пионтковская | Дмитрий Пионтковский | Евгений Бурнаев
    Материалы конференции 2021 года по эмпирическим методам обработки естественного языка

    Впечатляющие возможности современных генеративных моделей для создания текстов, которые сложно отличить от написанных человеком, могут быть использованы для создания фейковых новостей, обзоров продуктов и даже оскорбительного содержания. Несмотря на выдающуюся производительность существующих методов обнаружения искусственного текста, им по-прежнему не хватает интерпретируемости и устойчивости к невидимым моделям. С этой целью мы предлагаем три новых типа интерпретируемых топологических признаков для этой задачи на основе топологического анализа данных (TDA), который в настоящее время недостаточно изучен в области НЛП. Мы эмпирически показываем, что функции, полученные из модели BERT, превосходят базовые показатели на основе подсчета и нейронных сетей до 10% в трех распространенных наборах данных и, как правило, являются наиболее устойчивыми к невидимым моделям генерации в стиле GPT, в отличие от существующих методов. Зондирующий анализ признаков выявляет их чувствительность к поверхностным и синтаксическим свойствам. Результаты показывают, что TDA является многообещающим направлением в отношении задач NLP, особенно тех, которые включают поверхностную и структурную информацию.

    pdf нагрудник abs
    Преподавание массового открытого онлайн-курса по обработке естественного языка
    Екатерина Артемова | Мурат Апишев | Денис Кирьянов | Вероника Саркисян | Сергей Аксенов | Олег Сериков
    Материалы пятого семинара по обучению НЛП

    В этой статье мы представляем новый массовый открытый онлайн-курс по обработке естественного языка, предназначенный для неанглоязычных студентов. Курс длится 12 недель, каждая неделя состоит из лекций, практических занятий и контрольных заданий. Три недели из 12 сопровождаются заданиями по программированию в стиле Kaggle. Наш курс преследует несколько целей: (i) познакомить студентов с основными понятиями и методами НЛП, такими как моделирование языка или представление слов или предложений, (ii) показать, что последние достижения, включая предварительно обученные модели на основе Transformer, строить на этих концепциях; (iii) внедрить архитектуры для наиболее востребованных реальных приложений, (iii) развить практические навыки обработки текстов на нескольких языках. Курс был подготовлен и записан в течение 2020 года и на данный момент получил положительные отзывы.

    pdf нагрудник абс
    Трясущиеся синтаксические деревья на улице Сезам: многоязычное зондирование с контролируемыми возмущениями
    Екатерина Такташева | Владислав Михайлов | Екатерина Артемова
    Материалы 1-го семинара по многоязычному репрезентативному обучению

    Недавнее исследование приняло новую экспериментальную область, основанную на концепции текстовых возмущений, которая показала, что перемешанный порядок слов практически не влияет на последующую производительность языка на основе Transformer. моделей во многих задачах НЛП. Эти результаты противоречат общепринятому пониманию того, как модели кодируют иерархическую и структурную информацию, и даже ставят под сомнение, моделируется ли порядок слов с помощью вложений позиций. С этой целью в данной статье предлагается девять наборов данных зондирования, организованных по типу контролируемого возмущения текста для трех индоевропейских языков с разной степенью гибкости порядка слов: английского, шведского и русского. Основываясь на зондирующем анализе моделей M-BERT и M-BART, мы сообщаем, что синтаксическая чувствительность зависит от языка и целей предварительной подготовки модели. Мы также обнаружили, что чувствительность растет по слоям вместе с увеличением детализации возмущения. И последнее, но не менее важное: мы показываем, что модели почти не используют позиционную информацию для создания синтаксических деревьев из своих промежуточных самовниманий и контекстуальных представлений.

    2020

    pdf нагрудник abs
    Совместный подход к расщеплению и обнаружению идиоматических соединений
    Ирина Кротова | Сергей Аксенов | Екатерина Артемова
    Материалы Двенадцатой конференции по языковым ресурсам и оценке

    Такие приложения, как машинный перевод, распознавание речи и поиск информации, требуют эффективной работы с составными существительными, поскольку они являются одним из возможных источников слов, выпадающих из словаря. Углубленная обработка именных соединений требует не только их расщепления на более мелкие составляющие (или даже корни), но и выявления экземпляров, которые должны оставаться нерасчлененными, поскольку они имеют идиоматический характер. Мы разрабатываем двойной подход, основанный на глубоком обучении: разделение составных существительных и обнаружение идиоматических составных частей для немецкого языка, который мы обучаем, используя недавно собранный корпус аннотированных немецких составных частей. Наш нейронный разделитель составных существительных работает на уровне подслов и превосходит текущий уровень техники примерно на 5% 9.0003

    pdf нагрудник abs
    Устранение многозначности Word Sense для 158 языков с использованием только вложений Word
    Варвара Логачева | Денис Тесленко | Артем Шелманов | Стеффен Ремус | Дмитрий Усталов | Андрей Кутузов | Екатерина Артемова | Крис Биманн | Симоне Паоло Понцетто | Александр Панченко
    Материалы Двенадцатой конференции по языковым ресурсам и оценке

    Устранение неоднозначности смыслов слов в контексте легко для человека, но представляет серьезную проблему для автоматических подходов. Для решения этой задачи были разработаны сложные контролируемые и основанные на знаниях модели. Однако (i) присущее Ципфу распределение контролируемых обучающих экземпляров для данного слова и/или (ii) качество представления лингвистических знаний мотивируют разработку полностью неконтролируемых и не требующих знаний подходов к устранению неоднозначности смысла слов (WSD). Они особенно полезны для языков с ограниченными ресурсами, у которых нет ресурсов для построения контролируемых и/или основанных на знаниях моделей. В этой статье мы представляем метод, который принимает в качестве входных данных стандартную предварительно обученную модель встраивания слов и создает полноценный перечень значений слов, который можно использовать для устранения неоднозначности в контексте. Мы используем этот метод, чтобы создать набор инвентаризаций смысла для 158 языков на основе исходных предварительно обученных вложений слов fastText, разработанных Grave et al. (2018), что позволяет использовать WSD на этих языках. Модели и система доступны онлайн.

    pdf нагрудник abs
    SumTitles: набор данных для суммирования с низкой экстрактивностью
    Валентин Малых | Константин Чернис | Екатерина Артемова | Ирина Пионтковская
    Материалы 28-й Международной конференции по компьютерной лингвистике

    Существующие диалоговые реферативные корпуса являются весьма экстрактивными. Мы представляем методологию оценки извлечения набора данных и представляем новый корпус диалогов фильмов с низким уровнем извлечения для обобщения абстрактного текста наряду с базовой оценкой. Корпус содержит 153 тыс. диалогов и состоит из трех частей: 1) автоматически выровненные субтитры, 2) автоматически выровненные сцены из сценариев и 3) выровненные вручную сцены из сценариев. Мы также представляем алгоритм выравнивания, который мы используем для построения корпуса.

    pdf нагрудник абс
    RussianSuperGLUE: эталон оценки понимания русского языка
    Татьяна Шаврина | Алена Феногенова | Емельянов Антон | Денис Шевелев | Екатерина Артемова | Валентин Малых | Владислав Михайлов | Мария Тихонова | Андрей Черток | Андрей Евлампиев
    Материалы конференции 2020 года по эмпирическим методам обработки естественного языка (EMNLP)

    В этой статье мы представляем передовой тест для оценки общего понимания русского языка — Russian SuperGLUE. Последние достижения в области универсальных языковых моделей и преобразователей требуют разработки методики их широкой диагностики и тестирования на общие интеллектуальные навыки — обнаружение естественно-языкового вывода, здравого смысла, способности выполнять простые логические операции вне зависимости от тематики текста или лексики. Впервые для русского языка с нуля был разработан бенчмарк из девяти заданий, собранных и организованных по аналогии с методикой SuperGLUE. Мы также предоставляем исходные данные, оценку на человеческом уровне, платформу с открытым исходным кодом для оценки моделей и общую таблицу лидеров моделей трансформеров для русского языка. Кроме того, мы представляем первые результаты сравнения многоязычных моделей в наборе переведенных диагностических тестов и предлагаем первые шаги к дальнейшему расширению или оценке современных моделей независимо от языка.

    2019

    pdf нагрудник abs
    Набор данных для определения композиционности существительных для славянского языка
    Дмитрий Пузырев | Артем Шелманов | Александр Панченко | Екатерина Артемова
    Материалы 7-го семинара по балто-славянской обработке естественного языка

    В этой статье представлен первый ресурс золотого стандарта для русского языка, аннотированный информацией о составе составных существительных. Составные фразы собираются из древовидных банков универсальных зависимостей в соответствии с шаблонами частей речи, такими как ПРИЛАГ + СУЩЕСТВИТЕЛЬНОЕ или СУЩЕСТВИТЕЛЬНОЕ + СУЩЕСТВИТЕЛЬНОЕ, с использованием аннотаций золотого стандарта. Каждое составное словосочетание аннотируется двумя экспертами и модератором по следующей схеме: словосочетание может быть как композиционным, так и некомпозиционным, или двусмысленным (т. е. в зависимости от контекста может трактоваться и как композиционное, и как некомпозиционное). Мы проводим экспериментальную оценку моделей и методов для прогнозирования композиционности составных имен существительных в неконтролируемых и контролируемых установках. Мы показываем, что методы из предыдущей работы, оцененные на предложенном русскоязычном ресурсе, достигают производительности, сравнимой с результатами на англоязычных корпусах.

    pdf нагрудник abs
    Многоязычное распознавание именованных сущностей с использованием предварительно обученных вложений, механизма внимания и NCRF
    Антон Емельянов | Екатерина Артемова
    Материалы 7-го семинара по балто-славянской обработке естественного языка

    В этой статье мы решаем задачу распознавания многоязычных именованных объектов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *