Фестиваль РИТ++ 2016 завершён. Изучайте презентации, смотрите фотографии и ждите видео :)
Профессиональная конференция для серверных веб-разработчиков

Автоматическая рубрикация текстовТеория программирования

Доклад принят в программу конференции
Злата Обуховская

Технический руководитель новостного агрегатора Рамблер/Новости, в прошлом разработчик-исследователь в компании Яндекс.

1. Задачи по объединению текстов в группы.
1.1 Что такое кластеризация текстов, где она полезна, какие задачи решает.
1.2 Что такое классификация применительно к текстам, примеры использования.

2. Тематическое моделирование.
2.1. Генеративные языковые модели.
2.2. Вероятностные латентно-семантические модели (pLSA).
2.3. Латентное размещение Дирихле (LDA).
2.4. Обзор инструментов для тематического моделирования.

3. Решение задач кластеризации и рубрикации на потоке новостных текстов.

Другие доклады секции Теория программирования