
Сан-Франциско часто называют центром ИИ, но не все компании должны располагаться в одном и том же небольшом районе. ElevenLabs иллюстрирует, как уникальная история возникновения, географические условия и корпоративная культура с самого начала дают конкурентное преимущество. На примере этой компании видно классические задачи отрасли: завоевание доверия пользователей и творческих профессионалов, а также масштабирование команды без потери уникальности.
Основатели ElevenLabs начали в Лондоне как небольшая команда с простой целью — дать машинам голос, максимально похожий на человеческий. За три года компания выросла в одну из быстрорастущих организаций в области ИИ и создала экосистему для работы с голосом, музыкой и разговорными агентами. Вопрос состоит в том, что отличает их от других — исключительно мастерство в синтезе голоса или ещё и организационные решения.
Помимо голосовых моделей команда занялась двумя дополнительными задачами: глобальным набором сотрудников и стратегическим управлением временными рамками продуктов и исследований. ElevenLabs формирует команду по всему миру и выстраивает процессы так, чтобы учитывать обратную связь как потребительских, так и корпоративных клиентов. Это помогает одновременно балансировать быстрые итерации и долгие интеграции.
Расположение в Европе играет роль преимущества при создании голосовых продуктов и их глобальном распространении. Небэнефиты и потребности, которые испытывают люди, для которых английский не является родным, дают ценное понимание нюансов голоса и локализации. Такое восприятие сложно сформировать команде, полностью базирующейся в одной англоязычной точке.
В компаниях, ориентированных на исследования, приоритет обычно у научных задач, но прогресс исследований не всегда совпадает с запросами клиентов. В ElevenLabs выработали практику: если исследовательское решение требует более трёх месяцев, команда ищет продуктовый обходной путь. Это позволяет поддерживать спрос и при этом не тормозить развитие.
Компания стремится работать с творческой индустрией, а не обходить её стороной. Вместо конфронтации команда общалась с артистами, продюсерами и лейблами, чтобы понять, где ИИ может помогать, а где важно сохранять человеческое выражение. Такой подход формирует доверие и способствует сотрудничеству с профессионалами медиа-индустрии.
Тон, интонация и другие вокальные нюансы несут значительную долю смысла в устной речи, и этот смысл сильно варьируется между культурами. ElevenLabs подчёркивает, что продукт не будет полноценным, если команда не имеет международного состава и соответствующих предпосылок. Международность помогает лучше захватывать культурные и языковые вариации голоса.
В англоязычных странах часто принимают как данность широкий спектр эмоций и акцентов в голосовом контенте. При дубляже на другие языки это разнообразие может исчезать, и продукт теряет часть выразительности. Понимание этой проблемы лежало в основе стремления ElevenLabs улучшить синтез речи для множества языков.
Изначально в Польше многие зарубежные фильмы дубляжили одним актёром в монотонной манере, что стало одним из мотивов для создания текст-в-речь решения. Это практическое наблюдение помогло команде определить рыночную потребность в более выразительном и разнородном синтезе голоса. Понимание локальных привычек озвучивания стало источником продуктовой идеи.
По мере роста команды — сейчас в компании около 350 сотрудников — ElevenLabs организовала офисы в Лондоне, Варшаве и Сан‑Франциско. Наличие нескольких хабов помогает не только в развитии культуры офиса, но и в накоплении разнообразного опыта по работе с голосом. Международные команды воспринимают голос как гибкий уровень абстракции, применимый в разных контекстах.
Команда пришла к выводу, что для привлечения лучших специалистов нужно нанимать по всему миру и не ограничиваться только одной локацией. Такое решение позволило собрать разнообразные компетенции и избежать «локального» взгляда на продукт. Глобальный найм стал ключевым фактором расширения возможностей компании.
Сочетание модели и продукта играет критическую роль: продукт, тесно взаимодействующий с моделью, обеспечивает быстрый цикл обратной связи и улучшение модели на основе использования. В тех случаях, когда исследования не дают немедленного решения, продукт может временно выполнять нужные функции. Это помогает объединять длинные исследовательские горизонты с потребностями рынка.
Малые продуктовые решения, например особенности голосовой генерации или интерфейса для интеграции, могут существенно повлиять на эволюцию и модели, и продукта. Интерфейс следует проектировать чуть впереди того, на что модель способна самостоятельно. Такой подход минимизирует разрыв между исследовательскими возможностями и ожиданиями пользователей.
Один из реальных примеров — запрос пользователей на регулировку скорости голоса. Команда сначала пыталась решить это исключительно на уровне исследований и работала над задачей около девяти месяцев. В итоге было принято простое продуктовое решение — добавить ползунок скорости — и это удовлетворило пользователей быстрее, чем продолжение работы в исследовательской плоскости.
По мере масштабирования компании возникают новые вызовы, связанные с мотивацией сотрудников. ElevenLabs прошла стадии продуктовой разработки, построения продаж и масштабирования, и обнаружила, что нужно проектировать правильные стимулы. Ранее многие решения принимались на основе энтузиазма, но в крупной организации этого недостаточно.
В одном случае обсуждалась сделка, которая принесла бы значительную комиссию продавцам, но могла ослабить стратегическую позицию компании в конкурентной области. В результате компания выбрала приоритет сохранения исследовательской собственности и разработала схему мотивации, при которой продавцы могли получать вознаграждение даже за сделки, которые затем отклонялись. Это позволило согласовать краткосрочные интересы продаж с долгосрочной стратегией.
Взаимодействие с творческой индустрией стало принципом работы ElevenLabs: компания проводила встречи с артистами и представителями лейблов, чтобы объяснять технологию и слушать опасения. Такой диалог позволил снизить автоматические негативные реакции и найти модели сотрудничества. Важным элементом была прозрачность и вовлечение заинтересованных сторон.
Результатом стал Голосовой маркетплейс, где создатели могут клонировать, лицензировать и монетизировать свои голоса. На платформе накопилось почти 10 000 голосов, и компания вернула сообществу около 10 миллионов долларов. Маркетплейс превратил поиск талантов в многоязычное глобальное явление и расширил аудиторию для отдельных голосов.
Подход к голосу компания сравнивает с программным обеспечением: голос можно «запустить» на любом языке, сохранив индивидуальную выразительность. Это меняет представление о голосе как о локальном ресурсе и делает его переносимым между рынками и языками. Такая трансформация открывает новые возможности для творческих профессионалов.
ElevenLabs использовала аналогичный метод для музыки, заключив соглашения с крупнейшими лейблами и другими держателями прав для создания лицензированной музыкальной модели. Достижение договорённостей заняло около 18 месяцев и требовало постоянной прозрачности и взаимодействия. В результате компания выстроила редкий для генеративного ИИ формат сотрудничества с музыкальной индустрией.
Переход от массового потребителя к корпоративным клиентам меняет восприятие сроков и приоритетов. Количество важных сделок растёт, но циклы продаж и внедрений растягиваются на месяцы. Важно выстраивать организацию, которая умеет работать в «быстром» и «медленном» режимах одновременно.
В начальной стадии компания получила много запросов от корпоративных клиентов, но команда состояла преимущественно из инженеров и исследователей. Попытка поручить инженерам продажу привела к ошибке и показала необходимость специализированных ролей. Это подтолкнуло к изменению структуры команды и распределению обязанностей.
Компания ввела роли с соотношением обязанностей примерно 80% продаж и 20% инженерии, чтобы лучше понимать клиентов и предлагать релевантные продуктовые решения. Такой формат помог повысить качество взаимодействия с заказчиками и быстрее выявлять требования для интеграции. Это также способствовало формированию предложений для различных отраслей.
Для обслуживания больниц, телекомов и медиа‑платформ ElevenLabs пришлось не только развивать модели, но и строить конвейеры данных и интеграции. В результате голосовые и агентные платформы компании используются в медицине, службах поддержки и развлекательных приложениях. То, что начиналось как инструмент для создателей, превратилось в полноценный корпоративный стек.
В компании действует около 20 продуктовых команд по 5–10 человек, что позволяет сочетать скорость разработки и дисциплину корпоративных проектов. Некоторые команды работают с уже достигшим спроса продуктом и отвечают за надёжность и качество, а другие действуют как малые стартапы внутри организации и имеют шесть месяцев на проверку рыночной состоятельности своих идей. Такой баланс помогает одновременно поддерживать стабильные сервисы и развивать новые направления.
Изначально команда была ориентирована на быструю обратную связь от создателей, а работа с корпоративными клиентами требовала больше терпения и длительных циклов. Часть сотрудников была скептически настроена к ожиданию шести или двенадцати месяцев, но компания выстроила защиту для таких команд и сумела доказать эффективность нового подхода. Эти меры принесли ожидаемые результаты.


Комментариев