Обеспечение качества данных в графах знаний
-
-
20 мин
Все больше компаний строят и используют графы знаний. Графы знаний активно применяются для улучшения пользовательских рекомендаций (амазон, нетфликс), для анализа фондового рынка (goldman sachs), поиске (яндекс, гугл) и даже для поиска новых молекул.
Зачастую создание и наполнение информацией графа происходит автоматически или полуавтоматически. В последствие, от качества данных в графе зависят конечные функции графа (качество предсказания, достоверность выведенных фактов). Поэтому обеспечение качества данных в графе очень важный процесс, и подходить к нему надо ответственно.
В этом докладе я расскажу про различные подходы осуществления контроля данных в графе.