Аналитика

Статистический анализ данных с применением моделей искусственного интеллекта.

Специалисты Акын Автоматика имеют совокупный опыт 35 человеко-лет в области статистического анализа, обработки и инженеринга больших массивов данных, машинного обучения и построения моделей, макетинговой аналитики, а также финансовой и контрактной аналитики.

Приведём несколько примеров опубликованных аналитических продуктов. Свяжитесь с нами через форму обратной связи если хотите сотрудничать в этой области.

Образование

Команда Акын Автоматика имеет большой опыт в аналитике и моделировании данных из системы образования и временных рядов. Приведённый ниже анализ был произведён на данных 11 000 учащихся из 50 школ и 280 разных классов. Данные были собраны во время уроков алгебры в 6-8 классах во время сравнительного эксперимента по внедрению дифференцированного обучения с поддержкой автоматизированного построения индивидуальных планов обучения.

Одним из критериев оценки была т.н. “дважды нормированная ошибка” — количество ошибок на задачу в час. Графики апроксимации среднего уровня уровня такой ошибки в классе приведены ниже для двух групп классов — тех кто следовал рекомендациям индивидульного планирования обучения (зелёный цвет), и тех кто не следовал (красный цвет).

Анализ данных школьного курса алгебры.

На графике видно, что для “зелёной” группы (те кто следовал индивидуальным планам) уровень дважды нормированный ошибки ниже по среднему начению и по доверительному интервалу. Этот уровень приблизительно постоянен на протяжении учебного года. Тогда как для “красной” группы (те кто не следовал индивидуальным планам) этот уровень выше и по среднему значению и по вариативности, а также растет по ходу учебного года. В академическом смысле, дважды нормированный уровень ошибки можно интерпретировать как уровень учебной нагрузки.

Стоит отметить, что внедрение дифференцированного обучения требует от школ и учителей дополнительных ресурсов и усилий. Учеников следует группировать по текущему уровню знаний, с каждой группой проводить сфокусированные мини-уроки. Учителю нужно уметь разделять своё внимание и контролировать несколько учебных под-процессов. Ситуация похожа на ту, когда, в сельских школах XIX в. в классной комнате, зачастую, сидели ученики разных классов и разных уровней подготовки и учитель должен был управлять процессом обучения каждого из них. Без дифференцированного подхода к обучению может возникать ситуация, когда “одни ученики не понимают, а другим скучно”.

Патенты

Анализ динамики подачи патентных заявлений в одной из самых патентоёмких стран — Соединённых Штатах — представляет особый интерес. Эта страна позиционирует себя как мировой лидер в сфере инноваций. На приведённом ниже графике показано изменение общего числа поданных патентных заявок за весь период открытой статистики — с 1963 по 2020 год. Примечательно, что с 1991 года количество заявок стабильно росло, однако в 2016 году этот рост прекратился.

Заявки на патенты в США 1963-2020 гг.

Лингвистика

С ноября 2022 года сфера информационных технологий, аналитики и повседневных рабочих процессов испытывает значительное влияние машинного обучения, искусственного интеллекта и лингвистических технологий, проявившихся в развитии больших языковых моделей. Одним из направлений нашего интереса к вычислительной лингвистике стало сравнение альтернативных версий различных текстов, включая тексты Ветхого Завета. Ниже представлена визуализация так называемых лингвистических расстояний между стихами из первых 24 глав Книги Бытия в переводе проф. Юнгерова и в синодальном переводе.

Лингвистические расстояния в Быт. 1-24 между стихами\n в синодальным и Юнгеровском переводе, гистограмма.

Среди самых ярких численно и при визуальном сравнении можно выделить следующие примеры.

ПРИМЕР 1. лингвистическое расстояние 0.635
4:7 Юнгеров:     Если ты правильно принес, то правильно-ли отделил? чрез это не согрешил-ли? 
                 успокойся: к тебе обращение его, и ты обладать им будешь.
4:7 Синодальный: если делаешь доброе, то не поднимаешь ли лица? а если не делаешь доброго, 
                 то у дверей грех лежит; он влечет тебя к себе, но ты господствуй над ним.

ПРИМЕР 2. лингвистическое расстояние 0.527
4:21 Юнгеров:     А имя брату его: Иувал, он изобрел псалтирь и цитру.
4:21 Синодальный: Имя брату его Иувал: он был отец всех играющих на гуслях и свирели.

ПРИМЕР 3. лингвистическое расстояние 0.344
5:24 Юнгеров:     И угоден был Енох Богу, и не найден был, потому-что преложил его Бог.
5:24 Синодальный: И ходил Енох пред Богом; и не стало его, потому что Бог взял его.

<к продуктам