doing something

@doing_something
Latest publications
Publication date:
22 Apr, 08:12
В школах та університетах будуть писати про цих піонерів перших українських ЛЛМок:
Рекомендую до перегляду, технічно та цікаво
Доречі, блог Ганни отут: https://t.me/potuzhno_llm
#llm #nlp
👁 79 👍 4 💬 0 🔁 1 Publication date:
21 Apr, 10:11
переписав хату на Rust
👁 284 👍 33 💬 0 🔁 12 Publication date:
21 Apr, 07:17

Теж спробував Літаюче колесо після вчорашнього прочитання посту у Задухи.
У мене невеликий тест цього сервісу, що дає свій MCP для вашого агента (умовний Клодекс), на задачі автоматичного розпізнавання мови.
Код який був створений з цим MCP: https://github.com/PositiveLoss/paraformer-v2-enhanced
Використовував їх скіл flywheel-reproduce. По відчуттях: доволі швидко зробило репродюс статті https://arxiv.org/abs/2409.17746 та дало список покращень до архітектури яка реалізована в better_model.py файлі
Я допиляв трохи інженерного: покращив вітербі CTC-алайнер.
Враження залишилось позитивне, вивантаження результатів в ноди дійсно покращує розуміння роботи цього ко-саєнтиста.
#autoscience
👁 462 👍 2 💬 0 🔁 12 Publication date:
20 Apr, 07:16
Додав код для генерації біндінгів для:
• NodeJS
• C#, C, C++
• Java, Kotlin, Scala
• Swift
• Ruby
• Go
• PHP
Інтеграція в інші застосунки стане тривіальною справою.
👁 287 👍 2 💬 0 🔁 2 Publication date:
19 Apr, 13:54
Опубліковано:
https://github.com/RustedBytes/w2v-bert-uk
В релізах wheels для Linux, macOS, Windows систем які можна використати в Python проєктах: 3.10+.
• Доступні як біндінги на Rust, так і сам крейт для використання.
• Можна брати FP16 або FP32
• Доступний реранкер для слів на основі KenLM
• Beam Search за замовчуванням
• ONNX Runtime з CPU, CUDA, CoreML бекендами
• Аудіо не треба семплити до 16 kHz, фічарайзер сам зробить це
Якщо знайшли баг, створіть тікет на GitHub
• Колаб з прикладом використання: тиць
• Код із скриптами тренування для файн-тюну: тиць
• Банка для підтримки опен сорсу: тиць
Підписуйтесь на мій тг-блог @doing_something щоб отримувати оновлення. Планується додати ще кілька невеликих моделей для мобільних девайсів, бо цей реліз розрахований на сервери.
Також підписуйтесь на ініціативу на HF: speech-uk
#asr #ml
👁 571 👍 1 💬 0 🔁 5 Publication date:
19 Apr, 12:16
Доречі, код трейну та інференсу відкритий:
https://github.com/PositiveLoss/squeezeformer-ukrainian
Можете тюнити як завгодно.
👁 188 👍 2 💬 0 🔁 1 Publication date:
19 Apr, 11:16
Ось тут оптимізований онікс в FP16:
https://huggingface.co/speech-uk/w2v-bert-v3-onnx
Також, пізніше сьогодні буде реліз бібліотеки на Rust та Python для використання цієї моделі.
👁 179 💬 0 🔁 0
Russian


