Сюда входит аппроксимация бинарных растровых изображений многоугольными фигурами, медиальное представление фигур, вычисление скелетов, сравнение и преобразование формы на основе медиального представления. Будут рассмотрены приложения непрерывных моделей формы в распознавании изображений. Первое занятие состоится 2. В курсе обсуждаются основные проблемы, возникающие при использовании методов обучения по прецедентам (машинного обучения). Обсуждаются способы повышения обобщающей способности – точности прогноза на новых данных. Рассказывается о тесно связанной с задачей машинного обучения задаче поиска закономерностей в данных. Под закономерностью понимается некоторое относительно простое правило, связывающее прогнозируемую величину с другими переменными.
Рассказывается о современных методах статистической верификации закономерностей, основанных на перестановочных тестах. Обсуждаются методы распознавания и регрессионного анализа, основанные методы, основанные на вычислении коллективных решений по системам закономерностей. Рассказывается также о различных методах кластерного анализа.
Приведены примеры успешно решённых задач диагностики, прогнозирования, интеллектуального анализа данных в различных областях, включая медицину, антропологию, социологию, химию др. Приглашаются бакалавры. Спецкурс проходит по четвергам в ауд. Первое занятие состоится 2. Основная цель спецкурса состоит в изложении основанных на оптимизационных, дискретных и эвристических подходах методов анализа данных. Будут рассмотрены логические модели распознавания (классификации с учителем) и анализа разнотипных многомерных данных, методы оптимизации моделей распознавания, алгоритмы поиска скрытых логических закономерностей и связей по признаковым описаниям, методы создания качественных моделей объектов, ситуаций, явлений или процессов.
Будут рассмотрены практические численные методы решения данных задач, и их применения в медицине, бизнесе, химии, технике и других областях. Приглашаются бакалавры. Спецкурс проходит по вторникам, начало в 1. Первая лекция состоится 1. Материаловедение Лабораторные Работы Гуап тут. В данном курсе излагаются теоретические и практические знания, которые понадобятся всем будущим аналитикам, ведь всем им предстоит собирать и хранить данные, «разглядывать» их самим и показывать другим. Модели данных – это стандартные в области аналитической деятельности «языки», на которых аналитики рассказывают друг другу о данных. Курс учит пользоваться этими общераспространенными «языками», что обеспечивает взаимопонимание при аналитической деятельности.
Визуализация – это тоже форма рассказа о данных, соответственно, она тоже происходит в рамках таких «языков». Важнейшую роль такие «языки» получили в консалтинговых и аналитических подразделениях «Большой четверки». В современном анализе данных принято выделять три уровня задач, методов и соответствующих технологий: сбор и хранение данных, оперативная аналитика и визуализация, интеллектуальный анализ. Обычно бизнес, опирающийся на анализ данных, последовательно проходит все эти уровни.
Всем сотрудникам компаний, непосредственно занимающимся или поддерживающим аналитическую деятельность, постоянно приходится работать с первыми двумя уровнями. Сложные математические модели преобразования информации (машинное обучение) относятся к последнему третьему уровню. Разумеется, в эру больших данных в первую очередь выросла сложность задач и технологий первых двух уровней.
Общеизвестным примером является система Google Analytics. Будут рассмотрены основные модели данных – разные способы мыслить и формализовать представление информации в аналитике.
В связи с этим будет рассмотрена «аналитическая» часть SQL. В свою очередь, о визуализации будет рассказано одновременно с позиций аналитических целей и моделей данных. Будут рассмотрены «гиганты визуализации» – системы Qlik. View и Tableau,– развивающие идеологию OLAP. Будут рассмотрены практики «рассказывания историй по данным» (storytelling with data) и «интерактивных панелей». В курсе основное внимание уделяется «языку» аналитического общения, соответственно, большая его часть доступна бакалаврам первого- второго курсов.
Предполагается, что студенты подготовят панель и сделают доклад о данных по актуальной для них жизненной проблеме. Спецкурс проходит по понедельникам в ауд. Первое занятие состоится 1. В спецкурсе будут изложены общие принципы, лежащие в основе дискретных методов анализа информации в задачах распознавания, классификации и прогнозирования. Будут рассмотрены подходы к конструированию процедур распознавания на основе использования аппарата логических функций и методов построения покрытий булевых и целочисленных матриц. Будут изучены основные модели и рассмотрены вопросы, связанные с исследованием сложности их реализации и качества решения прикладных задач. Спецкурс для бакалавров.
По спецкурсу издано учебное пособие. Спецкурс проходит по понедельникам в ауд.
Первое занятие состоится 0.