News

Latest news and updates from DSML Kazakhstan community
Stay up to date with the latest events

Daily UpdatesCurrent News

Свежая новость

22 фев 2024

Post image
Beetech Conf | 27.04.2024 | Almaty

27 апреля в Алматы пройдёт ежегодная beetech conf от Beeline Казахстан.

Открыт сбор докладов на конференцию, где будут представлены самые актуальные и интересные кейсы с максимальной пользой для участников конфы.

Заявки принимаются до 7 марта. Переходите по ссылке и оставляйте заявки: Beetech 2024 speakers.

В этом году будет 3 стрима: Big Data, Engineering и Management (Product + Agile).

Фокусные темы этого года по Big Data:
• применение AI в производстве;
• инструменты для хранения и обработки больших данных (Hadoop / Spark / Airflow или аналоги);
• эксплуатация систем на базе машинного обучения: CI / CD пайплайны, ML Ops / ML Flow;
• версионирование моделей и датасетов.

Если у вас есть другая актуальная тема, то вы также можете заполнить заявку, и ее обязательно рассмотрят.

Прием заявок открыт до 7 марта
Beetech 2024 speakers

Свежая новость

4 янв 2024

Post image
Поздравляем участника нашего Сообщества Исагали Конысбаева, который разработал уникальную рекомендательную систему для подбора вакансий на основе резюме соискателей, используя передовые модели NLP (Natural Language Processing)!

Эта система, в сотрудничестве со специалистами IT и аналитиками АО “Центр развития трудовых ресурсов” (АО “ЦРТР”), адаптирована и внедрена на платформе enbek.kz.

Сервис работает на основе FastAPI, sentence_transformers и PyTorch. Ядро системы состоит из NLP-модели, которая преобразует текст резюме и вакансий в так называемые embedding vectors. После фильтрации вакансий по различным параметрам, таким как регион или профессия, эти вектора используются для рассчета косинусного расстояния между векторами вакансий и вектором запроса резюме. Система выбирает ближайшие по расстоянию вектора по степени "схожести" (cosine similarity).

Особенностью этой системы является её способность обучаться не только на основе текущих профессий, но и на семантике образования, навыков и предыдущего опыта работы соискателя. Для этого Исагали использовал не окончательную модель, а checkpoint в середине процесса обучения, чтобы избежать переобучения исключительно на текущих профессиях.

Скорость выдачи рекомендаций высока благодаря использованию только retriever model, без дополнительной классификационной модели reranker. Обучение модели проводилось с использованием ContrastiveLoss, и хотя Исагали не успел исследовать другие функции потерь, потенциал для дальнейших улучшений системы остается огромным.

Этот проект, как сообщает пресс-релиз АО “ЦРТР”, не только демонстрирует важные инновации в области подбора персонала, но и открывает новые горизонты для использования NLP в решении реальных задач рынка труда.

Свежая новость

18 окт 2023

Post image
Наши товарищи Ерзат Дулат и Анвар Умаров из нашего сообщества на днях релизнул библиотеку для машинного обучения "Higgsfield".

Этот инструмент предоставляет возможность управления кластерами, обеспечивая их масштабируемость и отказоустойчивость.

Библиотека позволяет эффективно использовать ваш GPU-кластер, создавая системы сравнимые по мощности с ChatGPT.

Блогпост можно почитать тут

Всем успешных экспериментов! 🚀