Data mining ( добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Разведочный анализ данных (РАД, Exploratory data analysis (EDA)) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей. Термин EDA был введен математиком Джоном Тьюки, который сформулировал цели РАД следующим образом:
Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения. Основные вопросы:
Как из низкоразмерных представлений получать структуры высоких размерностей;
Как дискретные единицы складываются в глобальные структуры.