Towards Facts Extraction from Texts in the
Polish Language

Tomasz Boiński; Adam Brzeski

Абстрактный

Towards Facts Extraction from Texts in the Polish Language

Tomasz Boiński, Adam Brzeski

The Polish language differs from English in many ways. It has more complicated conjugation and declination. Because of that automatic facts extraction from texts is difficult. In this paper we present basic differences between those languages. The paper presents an algorithm for extraction of facts from articles from Polish Wikipedia. The algorithm is based on 7 proposed facts schemes that are searched for in the analyzed text. The analysis includes morphosyntactic tagging, named entity extraction and relation identification. The results acquired for an exemplary Wikipedia text is presented. We indicate the free word formation principle as the main difficulty in the Polish texts analysis. At the same time satisfactory performance of the tagging and analysis tools for the Polish language was confirmed in the conducted experiment.

Отказ от ответственности: Этот реферат был переведен с помощью инструментов искусственного интеллекта и еще не прошел проверку или верификацию

Основные моменты журнала

Adaptive Advanced Numerical Algorithms Автономные и контекстно-зависимые вычисления Агентное промежуточное ПО Безопасность базы данных Беспроводные датчики Биоинформатика и вычислительная биология Грид-вычисления Охранные системы Передовые вычислительные архитектуры Программное обеспечение с открытым исходным кодом Протокол связи CDMA/GSM Радарная технология Распознавание образов/изображений искусственного интеллекта Робототехника Специальная сеть Спокойная технология Структура данных Хранилище данных Широкополосная связь и интеллектуальные сети

Индексировано в

Индекс Коперника

Академические ключи

CiteFactor

Космос ЕСЛИ

РефСик

Университет Хамдарда

Всемирный каталог научных журналов

Импакт-фактор Международного инновационного журнала (IIJIF)

Международный институт организованных исследований (I2OR)

Cosmos

Посмотреть больше

Международные журналы

Инженерное дело медицинские науки Общие науки Фармацевтические науки

Международный журнал исследований в области компьютерной и телекоммуникационной техники

Абстрактный

Towards Facts Extraction from Texts in the Polish Language

Основные моменты журнала

Индексировано в

Международные журналы

Адрес