Статистический анализ данных с применением моделей искусственного интеллекта.
Специалисты Акын Автоматика имеют совокупный опыт 35 человеко-лет в области статистического анализа, обработки и инженеринга больших массивов данных, машинного обучения и построения моделей, макетинговой аналитики, а также финансовой и контрактной аналитики.
Приведём несколько примеров опубликованных аналитических продуктов. Свяжитесь с нами через форму обратной связи если хотите сотрудничать в этой области.
Команда Акын Автоматика имеет большой опыт в аналитике и моделировании данных из системы образования и временных рядов. Приведённый ниже анализ был произведён на данных 11 000 учащихся из 50 школ и 280 разных классов. Данные были собраны во время уроков алгебры в 6-8 классах во время сравнительного эксперимента по внедрению дифференцированного обучения с поддержкой автоматизированного построения индивидуальных планов обучения.
Одним из критериев оценки была т.н. “дважды нормированная ошибка” — количество ошибок на задачу в час. Графики апроксимации среднего уровня уровня такой ошибки в классе приведены ниже для двух групп классов — тех кто следовал рекомендациям индивидульного планирования обучения (зелёный цвет), и тех кто не следовал (красный цвет).
На графике видно, что для “зелёной” группы (те кто следовал индивидуальным планам) уровень дважды нормированный ошибки ниже по среднему начению и по доверительному интервалу. Этот уровень приблизительно постоянен на протяжении учебного года. Тогда как для “красной” группы (те кто не следовал индивидуальным планам) этот уровень выше и по среднему значению и по вариативности, а также растет по ходу учебного года. В академическом смысле, дважды нормированный уровень ошибки можно интерпретировать как уровень учебной нагрузки.
Стоит отметить, что внедрение дифференцированного обучения требует от школ и учителей дополнительных ресурсов и усилий. Учеников следует группировать по текущему уровню знаний, с каждой группой проводить сфокусированные мини-уроки. Учителю нужно уметь разделять своё внимание и контролировать несколько учебных под-процессов. Ситуация похожа на ту, когда, в сельских школах XIX в. в классной комнате, зачастую, сидели ученики разных классов и разных уровней подготовки и учитель должен был управлять процессом обучения каждого из них. Без дифференцированного подхода к обучению может возникать ситуация, когда “одни ученики не понимают, а другим скучно”.
Анализ динамики подачи патентных заявлений в одной из самых патентоёмких стран — Соединённых Штатах — представляет особый интерес. Эта страна позиционирует себя как мировой лидер в сфере инноваций. На приведённом ниже графике показано изменение общего числа поданных патентных заявок за весь период открытой статистики — с 1963 по 2020 год. Примечательно, что с 1991 года количество заявок стабильно росло, однако в 2016 году этот рост прекратился.
С ноября 2022 года сфера информационных технологий, аналитики и повседневных рабочих процессов испытывает значительное влияние машинного обучения, искусственного интеллекта и лингвистических технологий, проявившихся в развитии больших языковых моделей. Одним из направлений нашего интереса к вычислительной лингвистике стало сравнение альтернативных версий различных текстов, включая тексты Ветхого Завета. Ниже представлена визуализация так называемых лингвистических расстояний между стихами из первых 24 глав Книги Бытия в переводе проф. Юнгерова и в синодальном переводе.
Среди самых ярких численно и при визуальном сравнении можно выделить следующие примеры.
ПРИМЕР 1. лингвистическое расстояние 0.635
4:7 Юнгеров: Если ты правильно принес, то правильно-ли отделил? чрез это не согрешил-ли?
успокойся: к тебе обращение его, и ты обладать им будешь.
4:7 Синодальный: если делаешь доброе, то не поднимаешь ли лица? а если не делаешь доброго,
то у дверей грех лежит; он влечет тебя к себе, но ты господствуй над ним.
ПРИМЕР 2. лингвистическое расстояние 0.527
4:21 Юнгеров: А имя брату его: Иувал, он изобрел псалтирь и цитру.
4:21 Синодальный: Имя брату его Иувал: он был отец всех играющих на гуслях и свирели.
ПРИМЕР 3. лингвистическое расстояние 0.344
5:24 Юнгеров: И угоден был Енох Богу, и не найден был, потому-что преложил его Бог.
5:24 Синодальный: И ходил Енох пред Богом; и не стало его, потому что Бог взял его.