АйТиБорода


Channel's geo and language: Belarus, Russian
Category: Technologies


Программист, блогер и devrel. Пишу про IT, науку, AI, айтишный Ютуб, фигачу контент для айтишников.
Слава Україні. Жыве Беларусь.
YouTube: https://youtube.com/itbeard
AIA Podcast: https://bit.ly/aia-podcast
По вопросам: @iamitbeard

Related channels

Channel's geo and language
Belarus, Russian
Statistics
Posts filter


🔥 Новый выпуск про самую программерскую менеджерскую позицию уже на АйТиБороде!

Кто такой Team Lead Architect? Как работают команды архитекторов? Как нанимают и собеседуют архитекторов? Сложно ли быть тимлидом в команде, где каждый - лучший? Обо всём этом в сегодняшнем выпуске. Гость выпуска, Team Lead Backend Architecture, TeamLead, TechLead и соведущий подкаста "TeamLeadTalks" - Егор Балышев.
Заваривайте чаинский/кофеинский будет очень интересно! 😉

👉 YouTube: https://youtu.be/MzNRbpF9pEU
👉 Apple Podcasts: https://apple.co/41hwOIQ
👉 Google Podcasts: https://bit.ly/itbeard-googlepodcasts
👉 Spotify: https://spoti.fi/3Ktbf1Y
👉 Скачать mp3: https://podcast.itbeard.com/e/190


#материалы из выпуска про Team Lead Architect

🔹 Егор в Linkedin: https://www.linkedin.com/in/egor-balyshev-09794b1b0/
🔹 Подкаст "TeamLeadTalks": https://www.youtube.com/@TeamLeadTalks

Ссылки
🔸 Доклад про Олимп: https://youtu.be/hvTmrAl78jw?si=L0XQmiE1lqC7UWTp
🔸 Подкаст про большую пятерку на Team Lead Talks: https://youtu.be/btd5On3EgQE?si=frtoFF0UJEllHUaD

Книги
🔹 Jocko Willink, Leadership Strategy and Tactics: https://www.amazon.com/Leadership-Strategy-Tactics-Field-Manual/dp/1250226848
🔹 Jocko Willink, Extreme Ownership: https://www.amazon.com/Extreme-Ownership-U-S-Navy-SEALs-ebook/dp/B0739PYQSS
🔹 Jocko Willink, The Dichotomy of Leadership: https://www.amazon.com/Dichotomy-Leadership-Balancing-Challenges-Ownership/dp/1250354943/
🔹 David L. Marquet, Leadership Is Language: https://www.ozon.ru/product/leadership-is-language-the-hidden-power-of-what-you-say-and-what-you-don-t-1319141983/


⚡️Новый эпизод AIA Podcast расскажет про Devin, Grok-1, Gemini 1.5 и полесских робо-оленей!

Сегодня обсуждаем релиз Grok-1 в опенсорс, решаем заменит ли программистов Devin и что похожего есть на рынке, говорим об интервью Лекса Фридмана и Сэма Альтмана, в котором много рассказывали про GPT-5 и немного про Q*, делимся первыми впечатлениями о Gemini 1.5, даем ссылки на тонну сервисов для программистов и обсуждаем удобство работы айтишником в поездах и полесских робо-олений.

👉 YouTube: https://youtu.be/loK0phK9nsA
👉 Google Podcasts: https://bit.ly/aia-google
👉 Apple Podcasts: https://bit.ly/aia-apple
👉 Spotify: https://bit.ly/aia-spotify
👉 Скачать mp3: https://aia.simplecast.com/episodes/30

Приятного просмотра и прослушивания, друзья! 🥰


Forward from: Сиолошная
Google открыли для всех доступ к Gemini 1.5 Pro с 1М токенов контекста: https://aistudio.google.com/app/prompts/new_chat

Можно загрузить видео или целую папку с файлами для анализа

Го тестировать

4.8k 0 102 27 57

Мы с ребятами из awclub продолжаем эксперементировать с ИИ-генерацией подкастов. Выложили второй выпуск новостного подкаста "Most human-like podcast", и кажется что проработанная фоновая музыка и добавление нечеловеческого юмора сделали его прям интереснее первого выпуска: https://youtu.be/hUdtR7AEHos

Ваши мысли? Слушабельно ли это уже? Что бы добавили, какого наратива или еще чего? Или мб нафиг этих тостеров?


Посмотрел за вас новое интервью Ольтмана Фридману, и вот что подчеркнул для себя:

- GPT-5 будет настолько лучше GPT-4, как GPT-4 был лучше GPT-3.5
- Ольтман считает GPT-4 тупой сетью. Страшно представить с каким зверем он тогда работает в ОпенИИ сейчас.
- GPT-5 не будет в этом году (скорее всего). Но в течение пары месяцев ОпенИИ порадует нас новыми штуками.
- GPT-5 будет сильно более умным и рассудительным. Качественно новый уровень, возможно новая архитектура.
- КьюСтар Сэм вообще не комментирует. Кажется, что там прям AGI делают, судя по уровню конспирации.
- SORA существует, и она прекрасна.
- Вычислительные мощности будут новой валютой.
- Без термоядерного синтеза AGI не заведется.
- Маск мудак, но без него было бы тяжко, потому терпим (это не дословно, но считывалось).
- Скоро будем программировать натуральным языком. Качайте базу, программисты (почти буквально его слова).


Я тут купил таки подписку у твиттера, чтобы потестировать Grok, и могу уверенно сказать, что это шляпа, не стоящая 20$. Вы знаете, на что лучше потратить эти деньги (ChatGPT, ну или 20 баксов это 20 баксов, да Вить?).
Вот и новый влог про это: https://youtu.be/3GPj9XusR8E


Тут, кстати, идет конференция отчетная Nvidia. Показывают новые зверь-карты на базе платформы NVIDIA Blackwell, который ближайшие пол года будут обеспечивать нас качественным доступом к ChatGPT, Gimini, Claude, Grok и т.п.: https://www.youtube.com/watch?v=Y2F8yisiS6E&ab_channel=NVIDIA

Дженсен Хуанг явно закорешил с Джимми Янгом, ибо выступление прям живое и со стендапом. Короче, присоединяйтесь. А обсудить можно в нашем AI-чатике @aiapodcast


Тут выложили сырцы ттвиттерского AI-бота Grok.
Исходники выложил Игорь Бабушкин, тот самый малоизвестный разработчик xAI, который возможно умеет в русский язык, и которого я хочу позвать в АйТиБороду, но до которого нереально достучаться. Решил попробовать через issues. Лайкните или поддержите комментом там плз. Методы некрасивые, но блин, другие не работают: https://github.com/xai-org/grok/issues/9

Из забавного: там в ишуях пацаны уже и работу у Маска просят. Прям на русском 😅

UPD: Игорь закрыл ишью и пока никуда не написал. с 99% вероятностью можно считать эксперимент проваленным, но попытка достойная, всем спасибо!🥰


Пока кто-то гадает, сколько процентов нарисует себе моль (делаю ставку на то, что не меньше чем в 2020ом нарисовал его друган-таракан), я решил записать на камеру мысли на тему Дэвина от Cognition Labs. А точнее, рассказал как он (скорее всего) работает, что уже давно можно попробовать из подобного софта, и почему эта технология ещё не скоро нас, программистов, заменит.

Действительно, хайпавоз устроили знатный, причем для людей следящих за прогрессом хайп этот совсем непонятный, ибо прорывного ничего не показали. Ну разве что UI приятненький, но в 2024ом любой UI будет приятнее CLI для современных разрабов, понимаю... В общем, вот видео: https://www.youtube.com/watch?v=fd9Di97eQ0Y

Уже традиционно записываю блоги на руинглише, надо же в этих ваших европах его тренировать 😅


Если потратить еще пяток-десяток часов, то это дело можно автоматизировать полностью, API у всех сервисов есть, и довести до нажатия одной кнопки. Но делать этого я, конечно же, не буду xD

Хорошего вечера, и жду в комментах ваши подгорания от того, что ИИ убивает очередную сферу деятельности 😊

UPD: все описанные выше действия не стоили мне ни копейки, всё на триальных периодах и пробных версиях. Но если придется платить, то без видео один выпуск обойдется примерно в 1$, с видео в 10-60$ (в зависимости от частоты выхода подкаста, Pictory AI подписка, а не pay-as-you-go).

Результат: https://youtu.be/iF68Lt0foms


Как я с помощью ИИ подкаст сгенерил.

Сегодня расскажу вам, как я с помощью нескольких инструментов и пары часов дороги в автобусе бесплатно настроил пайалайн создания вполне сносных ИИ-подкастов с видео и сабтитрами.

Суть задачи: есть хорошо оформленный еженедельный дайджест ИИ-новостей в виде статьи, нужно преобразовать его в аудио-подкаст с хоть каким-то внятным видеорядом и сабтитрами.

Стек технологий:
- Claude API для создания сценария на озвучку из статьи;
- Python + ElevenLabs API для озвучки;
- Pictory AI для генерации видеоряда и сабтитров;

Разберемся по пунктам:

Claude API

Недавно компания Anthropic выкатила свою модель Claude 3 Opus, и она божественна. После недели заигрываний с ней у меня сложилось чёткое ощущение, что она обходит GPT-4 почти во всём. И однозначно она обходит его в создании сценариев для подкаста.

Потому, идем в Claude API (предварительно получив 5$ на его тестирование), задаем инициирующий промпт, где четко описываем как должен выглядеть ваш подкаст. Я решил разбивать статью на двух ведущих (спасибо за идею подкасту Оля и Штучный интеллект), о чем в промпте прям так и писал, мол есть два ведущих, Рон и Гермиона, и вот так-то они должны взаимодействовать. Гермиона задает вопросы, Рон отвечает, Гермиона дополняет и делает переход на следующую тему. Примерно такой промпт по содержанию.

Дальше нужно получить реплики ведущих, лучше в каком JSON-формате. Потому в пропмте описываем формат ответа: у меня это список json-объектов с полями id (порядковый номер реплики), name (имя ведущего) и text (содержание реплики). С этим файлом уже можно работать и скармливать его вашему любимому python.

На всё про всё ушло пол часа - час. Но в следующие разы это займёт минут пять, ибо системный инициирующий промпт уже готов.

Python + ElevenLabs API

Дальше я навоял простенький скрипт на питончике, который бежит по джейсону и озвучивает реплики разными голосами в зависимости от имен ведущих, сохраняет их на диск в формате .mp3. Сам скрипт лежат вот тут, их мне помогал писать ИИ, 24ый же год на улице. Из приятного, у Elevenlabs есть много настроек голосов, и можно играться с настройками их эмоциональности. Я выкрутил эмоции почти на максимум, мне нравится. Бесплатных минут генерации Elevenlabs даёт примерно 15-20, а дальше можно новый акк зарегать, чего уж.

Итого: написание скриптов и тестирование настроек голосов заняло часа два, но при повторении действий займёт минуты три, ибо надо будет только json обновить и запустить скрипт.

Склейка

Дальше склеиваю полученные .mp3 в один файл и подкладываю фоновую музыку. Я ленивый, сделал это за три минуты через Premier Pro.

Pictory AI

Этот замечательный сервис позволяет загрузить в него итоговый аудио-файл, получить из него текстовые блоки, на основании которых сервис генерирует сцены и сабтитры. Каждую сцену можно тонко настраивать вручную, менять сабы, менять стоковые видео для сцен, выделять акценты в сабах и кучу всего ещё. Итоговые сцены можно в два клика синхронизировать с аудио-дорожкой, надо ее только повторно загрузить в проект с сгенеренными сценами.

Этот этап для меня был самым долгим, так как я решил самостоятельно расставить акценты в сабах и кое-где поменять видео у сцен. Ушло на всё минут тридцать, и при повторении это время не уменьшается (хотя, можно забить на кастомизацию, и сделать всё за минут 5).

После этого я экспортиртнул видео в FullHD прям на сайте Pictory AI, залил его на Ютуб и радовался. На пробном периоде они дают экспортировать 3 видео, ну а дальше вы знаете что делать xD

Итоговый выпуск подкаста вы можете посмотреть тут: https://youtu.be/iF68Lt0foms. Не поленитесь оставить там комментарий на английском языке.

Сам я результатом удивлён прям сильно, ибо по факту технологии позволяют программисту средней руки за пару часов настроить пайплайн создания ИИ-подкастов студийного качества, с последующей генерацией выпусков за десятки минут с хорошим аудио и сносным видео-рядами. Вау. Двадцать первый век как есть.


На канале новый лидер по просмотрам: интервью с 78ми летним Евгением Владимировичем Полищуком набрало почти 1,1 миллиона просмотров, внезапно попав в рекомендации последних месяцев. И на самом деле заслуженно, ибо этот невероятный мужчина в свои 76 участвовал в хакатонах, изучил Питон листая книгу в книжном магазине, и пронёс любовь к программированию через всю жизнь, будучи по образованию биологом и учёным. Если вы ещё не видели этот выпуск, то вот: https://youtu.be/eqsg3Blzmdg


Сегодня выпустил второй англоязычный влог: про то как использовать ИИ-инструменты для программирования бесплатно (и даже приватно) + мини-экскурсия по польским Катовицам и отзыв на Дюну 2: https://youtu.be/GYfvbYrXDVU

Если влом ждать моего русскоязычного видоса про ИИ для программирования, то вот вам хороший затравочный контент 😊

7.8k 0 38 14 48

⚡️Свежая порция новостей ИИ в AIA Podcast №29

Сегодня делимся впечатлениями про Claude 3 и Mistral Large, обсуждаем дайверсити, скандал Маска и Альтмана, рассказываем про новые векторы атаки языковых моделей и рассказываем про первую ИИ-модель в мексиканском Playboy, так что будет горячо!

👉 YouTube: https://youtu.be/EMYX9ey5b7s
👉 Google Podcasts: https://bit.ly/aia-google
👉 Apple Podcasts: https://bit.ly/aia-apple
👉 Spotify: https://bit.ly/aia-spotify
👉 Скачать mp3: https://aia.simplecast.com/episodes/29


Я тут немного поигрался с Claude 3 Opus (самая мощная LLM от Anthropic) и с удивлением обнаружил, что она лучше всего на рынке умеет в Беларуский язык. Даже GPT-4 делает сильно больше ошибок. Видимо, придется покупать подписку ещё и на Claude 😅

И да, я поклонник проверять качество LLM через их работу с малыми языковыми группами.

Если вы не слышали или не пробовали Claude, то прям советую. Эта LLM разрабатывается бывшими сотрудниками OpenAI, и является по факту основным конкурентом GPT-4, местами даже обходя его (например по величине контекстного окна).

Чтобы попробовать их самую жирную версию модели, Opus, придется оформить подписку, а оформляется она только через американский VPN (в ЕС точно не прокатит).

Но есть лайфхак: идете на сайт их API, создаете там аккаунт, привязываете свой телефонный номер (польский прошел слегка) и получаете 5 баксов на тестирование API. Ну а дальше через веб-интерфейс песочницы API уже играетесь с Opus'ом (я скрин так и сделал).
#ai


💰 Двадцатый выпуск спонсорско-патронского солокаста "Новости Бороды" на всех платформах!

Сегодня рассказываю про слухи вокруг Claude 3, смерть Навального, новую камеру и касетную деку, про изучение сферы DevRel и английского, новый контент на каналах, про Стетхема, реслинг, Кин-дза-дзу и Хало 2

👉 YouTube: https://youtu.be/uvwulc-sSkY
👉 Patreon (видео): https://www.patreon.com/posts/99867578
👉 Patreon (аудио): https://www.patreon.com/posts/99869906


Пока все вокруг пытаются понять, есть ли у Claude 3 сознание и может ли она скопировать себя в интернет, я предлагаю вам послушать мысли про то, что думают об ИИ в программировании топовые разработчики: Паша Веллер (CTO EPAM), Дима Жемеров (автор Kotlin in Action) и Егор Толстой (TeamLead of Kotlin): https://youtu.be/S8y0DA-nJBQ


Вдохновился я тут короче влогами Миши Ларченко 😊
И решил попробовать делать в подобном стиле выпуски на английском, первый уже онлайн: https://youtu.be/YT8IjVhArZQ
ТОП 9 советов для программирования с ИИ внутри вашей IDE.

7.5k 0 22 12 61

Forward from: addmeto
Anthropic анонсирует Claude 3, в трех вариантах — Opus, Sonnet и Haiku. При этом Opus и Sonnet доступны уже сейчас, а Haiku — в ближайшие недели. Очень быстро все бегут вперед, ждем GPT4.5 в ближайшее время [o]

https://www.anthropic.com/news/claude-3-family

20 last posts shown.