Где строишь — кто ты: история ElevenLabs

Где строишь — кто ты: история ElevenLabs


65
17 поделились, 65 баллы

Сан-Франциско часто называют центром ИИ, но не все компании должны располагаться в одном и том же небольшом районе. ElevenLabs иллюстрирует, как уникальная история возникновения, географические условия и корпоративная культура с самого начала дают конкурентное преимущество. На примере этой компании видно классические задачи отрасли: завоевание доверия пользователей и творческих профессионалов, а также масштабирование команды без потери уникальности.

Основатели ElevenLabs начали в Лондоне как небольшая команда с простой целью — дать машинам голос, максимально похожий на человеческий. За три года компания выросла в одну из быстрорастущих организаций в области ИИ и создала экосистему для работы с голосом, музыкой и разговорными агентами. Вопрос состоит в том, что отличает их от других — исключительно мастерство в синтезе голоса или ещё и организационные решения.

Помимо голосовых моделей команда занялась двумя дополнительными задачами: глобальным набором сотрудников и стратегическим управлением временными рамками продуктов и исследований. ElevenLabs формирует команду по всему миру и выстраивает процессы так, чтобы учитывать обратную связь как потребительских, так и корпоративных клиентов. Это помогает одновременно балансировать быстрые итерации и долгие интеграции.

Расположение в Европе играет роль преимущества при создании голосовых продуктов и их глобальном распространении. Небэнефиты и потребности, которые испытывают люди, для которых английский не является родным, дают ценное понимание нюансов голоса и локализации. Такое восприятие сложно сформировать команде, полностью базирующейся в одной англоязычной точке.

В компаниях, ориентированных на исследования, приоритет обычно у научных задач, но прогресс исследований не всегда совпадает с запросами клиентов. В ElevenLabs выработали практику: если исследовательское решение требует более трёх месяцев, команда ищет продуктовый обходной путь. Это позволяет поддерживать спрос и при этом не тормозить развитие.

Компания стремится работать с творческой индустрией, а не обходить её стороной. Вместо конфронтации команда общалась с артистами, продюсерами и лейблами, чтобы понять, где ИИ может помогать, а где важно сохранять человеческое выражение. Такой подход формирует доверие и способствует сотрудничеству с профессионалами медиа-индустрии.

Тон, интонация и другие вокальные нюансы несут значительную долю смысла в устной речи, и этот смысл сильно варьируется между культурами. ElevenLabs подчёркивает, что продукт не будет полноценным, если команда не имеет международного состава и соответствующих предпосылок. Международность помогает лучше захватывать культурные и языковые вариации голоса.

В англоязычных странах часто принимают как данность широкий спектр эмоций и акцентов в голосовом контенте. При дубляже на другие языки это разнообразие может исчезать, и продукт теряет часть выразительности. Понимание этой проблемы лежало в основе стремления ElevenLabs улучшить синтез речи для множества языков.

Изначально в Польше многие зарубежные фильмы дубляжили одним актёром в монотонной манере, что стало одним из мотивов для создания текст-в-речь решения. Это практическое наблюдение помогло команде определить рыночную потребность в более выразительном и разнородном синтезе голоса. Понимание локальных привычек озвучивания стало источником продуктовой идеи.

По мере роста команды — сейчас в компании около 350 сотрудников — ElevenLabs организовала офисы в Лондоне, Варшаве и Сан‑Франциско. Наличие нескольких хабов помогает не только в развитии культуры офиса, но и в накоплении разнообразного опыта по работе с голосом. Международные команды воспринимают голос как гибкий уровень абстракции, применимый в разных контекстах.

Команда пришла к выводу, что для привлечения лучших специалистов нужно нанимать по всему миру и не ограничиваться только одной локацией. Такое решение позволило собрать разнообразные компетенции и избежать «локального» взгляда на продукт. Глобальный найм стал ключевым фактором расширения возможностей компании.

Сочетание модели и продукта играет критическую роль: продукт, тесно взаимодействующий с моделью, обеспечивает быстрый цикл обратной связи и улучшение модели на основе использования. В тех случаях, когда исследования не дают немедленного решения, продукт может временно выполнять нужные функции. Это помогает объединять длинные исследовательские горизонты с потребностями рынка.

Малые продуктовые решения, например особенности голосовой генерации или интерфейса для интеграции, могут существенно повлиять на эволюцию и модели, и продукта. Интерфейс следует проектировать чуть впереди того, на что модель способна самостоятельно. Такой подход минимизирует разрыв между исследовательскими возможностями и ожиданиями пользователей.

Один из реальных примеров — запрос пользователей на регулировку скорости голоса. Команда сначала пыталась решить это исключительно на уровне исследований и работала над задачей около девяти месяцев. В итоге было принято простое продуктовое решение — добавить ползунок скорости — и это удовлетворило пользователей быстрее, чем продолжение работы в исследовательской плоскости.

По мере масштабирования компании возникают новые вызовы, связанные с мотивацией сотрудников. ElevenLabs прошла стадии продуктовой разработки, построения продаж и масштабирования, и обнаружила, что нужно проектировать правильные стимулы. Ранее многие решения принимались на основе энтузиазма, но в крупной организации этого недостаточно.

В одном случае обсуждалась сделка, которая принесла бы значительную комиссию продавцам, но могла ослабить стратегическую позицию компании в конкурентной области. В результате компания выбрала приоритет сохранения исследовательской собственности и разработала схему мотивации, при которой продавцы могли получать вознаграждение даже за сделки, которые затем отклонялись. Это позволило согласовать краткосрочные интересы продаж с долгосрочной стратегией.

Взаимодействие с творческой индустрией стало принципом работы ElevenLabs: компания проводила встречи с артистами и представителями лейблов, чтобы объяснять технологию и слушать опасения. Такой диалог позволил снизить автоматические негативные реакции и найти модели сотрудничества. Важным элементом была прозрачность и вовлечение заинтересованных сторон.

Результатом стал Голосовой маркетплейс, где создатели могут клонировать, лицензировать и монетизировать свои голоса. На платформе накопилось почти 10 000 голосов, и компания вернула сообществу около 10 миллионов долларов. Маркетплейс превратил поиск талантов в многоязычное глобальное явление и расширил аудиторию для отдельных голосов.

Подход к голосу компания сравнивает с программным обеспечением: голос можно «запустить» на любом языке, сохранив индивидуальную выразительность. Это меняет представление о голосе как о локальном ресурсе и делает его переносимым между рынками и языками. Такая трансформация открывает новые возможности для творческих профессионалов.

ElevenLabs использовала аналогичный метод для музыки, заключив соглашения с крупнейшими лейблами и другими держателями прав для создания лицензированной музыкальной модели. Достижение договорённостей заняло около 18 месяцев и требовало постоянной прозрачности и взаимодействия. В результате компания выстроила редкий для генеративного ИИ формат сотрудничества с музыкальной индустрией.

Переход от массового потребителя к корпоративным клиентам меняет восприятие сроков и приоритетов. Количество важных сделок растёт, но циклы продаж и внедрений растягиваются на месяцы. Важно выстраивать организацию, которая умеет работать в «быстром» и «медленном» режимах одновременно.

В начальной стадии компания получила много запросов от корпоративных клиентов, но команда состояла преимущественно из инженеров и исследователей. Попытка поручить инженерам продажу привела к ошибке и показала необходимость специализированных ролей. Это подтолкнуло к изменению структуры команды и распределению обязанностей.

Компания ввела роли с соотношением обязанностей примерно 80% продаж и 20% инженерии, чтобы лучше понимать клиентов и предлагать релевантные продуктовые решения. Такой формат помог повысить качество взаимодействия с заказчиками и быстрее выявлять требования для интеграции. Это также способствовало формированию предложений для различных отраслей.

Для обслуживания больниц, телекомов и медиа‑платформ ElevenLabs пришлось не только развивать модели, но и строить конвейеры данных и интеграции. В результате голосовые и агентные платформы компании используются в медицине, службах поддержки и развлекательных приложениях. То, что начиналось как инструмент для создателей, превратилось в полноценный корпоративный стек.

В компании действует около 20 продуктовых команд по 5–10 человек, что позволяет сочетать скорость разработки и дисциплину корпоративных проектов. Некоторые команды работают с уже достигшим спроса продуктом и отвечают за надёжность и качество, а другие действуют как малые стартапы внутри организации и имеют шесть месяцев на проверку рыночной состоятельности своих идей. Такой баланс помогает одновременно поддерживать стабильные сервисы и развивать новые направления.

Изначально команда была ориентирована на быструю обратную связь от создателей, а работа с корпоративными клиентами требовала больше терпения и длительных циклов. Часть сотрудников была скептически настроена к ожиданию шести или двенадцати месяцев, но компания выстроила защиту для таких команд и сумела доказать эффективность нового подхода. Эти меры принесли ожидаемые результаты.


Понравилось? Поделитесь с друзьями!

65
17 поделились, 65 баллы

Какова ваша реакция?

Чего? Чего?
4
Чего?
Плачу Плачу
1
Плачу
Прикол Прикол
10
Прикол
Ого Ого
9
Ого
Злой Злой
8
Злой
Ржака Ржака
7
Ржака
Ух, ты! Ух, ты!
6
Ух, ты!
Ужас Ужас
4
Ужас
Супер Супер
1
Супер
Admin

Добро пожаловать на сайт Паутина AI. Здесь я публикую свежие новости, подробные обзоры и аналитику ведущих AI-сервисов. Оставайтесь c нами что бы быть в курсе событий в мире AI.

Комментариев

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выберите формат
Пост
Форматированный текст с вставками и визуальными элементами
Опрос
Голосование для принятия решений или определения мнений
Изображение
Фото или GIF
Видео
Вставки с YouTube, Vimeo или Vine
Аудио
Вставки с SoundCloud или Mixcloud
Мем
Загружайте свои изображения для создания собственных мемов
Send this to a friend