На Datathon 2018 Онтотекст ще се включи с казуса „Прогнозиране на взаимовръзки между дъщерни дружества, извлечени автоматично от новините чрез машинно обучение“
Българската компания за семантичен софтуер Онтотекст АД ще спонсорира за втора поредна година събитието Datathon, което традиционно събира специалисти и ентусиасти в областта на управлението и анализа на данни. Тазгодишното трето издание на Datathon ще се проведе от 9 до 11 февруари в София и ще обхване редица реални казуси, свързнаи с иновативни ИТ области като компютърното зрение, Natural Language Processing (NLP) и изкуствения интелект (AI, Artificial Intelligence). Организатор е Data Science Society. През тази година събитието ще се предава и онлайн.
На Datathon 2018 Онтотекст ще се включи с казуса „Прогнозиране на взаимовръзки между дъщерни дружества, извлечени автоматично от новините чрез машинно обучение“ (Machine learning (ML) prediction of parent-subsidiary relations from news). Идеята произхожда от реални бизнес казуси на клиенти на компанията, които често разполагат с огромни масиви от текстове и търсят възможности за по-ефективно извличане на информация от тях. Това включва както базови концепции за организации, хора и местоположения, така и за взаимоотношенията помежду им.
Чрез методите за машинно обучение изкуственият интелект вече може да извлича такива взаимоотношения, появяващи се в текста на база на съществуващи анотации. Този метод обаче предполага наличието на голям брой експертни анотации, което е скъпо и трудоемко начинание. Затова се търсят начини за обучаване на изкуствения интелект да извлича информация както от текстовете, така и отворени публични масиви от данни, използвайки ги за автоматично анотиране на много по-големи количества текст, отколкото човешки експерти биха могли да обработят. Казусът на Онтотекст ще предизвика екип от специалисти в областта на данните да използва подобни machine learning методи в текст, който вече е бил автоматично анотиран.
От страна на компанията в Datathon 2018 ще се включат и менторите др. Лаура Толоси – Халачева, главен учен в сферата на данните и Андрей Тагарев, софтуерен инженер. След събитието Онтотекст ще награди избрани участници в него.