
전 골드만·메타 출신 창업가, 아프리카·중동 겨냥 음성 AI 스타트업 AethexAI
📋 요약
골드만삭스와 메타 출신 두 창업가가 아프리카 및 중동 시장을 위한 음성 AI 스타트업 AethexAI를 설립하고 300만 달러의 프리시드 투자를 유치했습니다. 이들은 현지 방언을 처리하는 자체 모델을 개발하여 기존 솔루션이 간과했던 시장의 특정 요구사항을 해결합니다.
고객 지원 및 서비스는 현재 음성 AI 분야에서 가장 뜨거운 부문 중 하나입니다. 그러나 인간처럼 들리고 눈에 띄는 지연 없이 응답하는 제품을 만드는 것은 일부 시장에서 다른 시장보다 훨씬 더 어려운 것으로 판명되었으며, 주요 기업 대부분은 아프리카와 중동을 염두에 두고 구축되지 않았습니다. 이러한 격차를 해소하기 위해 작년에 설립된 스타트업 AethexAI는 4DX Ventures가 주도하고 Enza Capital, Dorm Room Fund, Mojo Ventures, Stanford GSB 26 Fund가 참여하여 300만 달러의 프리시드 펀딩(pre-seed funding)을 유치했습니다. 개인 투자자로는 스탠포드 교수진, 통신사 임원, Anthropic의 AI 연구원들이 포함됩니다. Vapi 및 LiveKit과 같은 기존 오케스트레이션 도구(orchestration tools)를 사용하는 대신, 이 회사는 목표 시장 전반에서 사용되는 영어, 프랑스어, 아랍어의 현지 방언(localized dialects)을 처리하기 위해 자체 소형 모델(small model)과 오케스트레이션 레이어(orchestration layer)를 처음부터 구축했습니다. 이는 해당 지역에서 운영하는 데 따르는 특정 요구 사항에 의해 결정된 것입니다. 이 회사는 또한 기업이 자사 기술을 시험하고 서비스에 가입할 수 있는 플랫폼을 출시하고 있으며, 개발자가 모델을 실험할 수 있는 API(API) 및 SDK(SDK)도 함께 제공합니다.
이 스타트업은 Mariama Diallo와 Ayooluwa Odemuyiwa가 공동 설립했습니다. CEO Diallo는 Goldman Sachs에서 근무했으며, 이후 YC가 투자한 ModelML에 제품 및 성장 담당자로 합류했습니다. CTO Odemuyiwa는 Caltech을 졸업하고 Meta에서 근무했으며, 회사를 공동 설립하기 전에 스탠포드 경영대학원에 등록했습니다.
두 사람은 신흥 시장을 위한 무언가를 만들고자 기회를 찾기 시작했습니다. 전 세계 기업들은 운영의 일부를 자동화하기 위해 AI 도구(AI tools)를 도입하기 위해 경쟁하고 있습니다. 그러나 항상 성공하는 것은 아닙니다. 창업자들은 이집트의 한 콜센터가 통화의 상당 부분을 자동화했지만, 결과가 좋지 않아 시스템을 철회했다는 사실을 발견했습니다. 아프리카의 여러 지원 센터에서는 적절한 비용으로 통화를 자동화할 엔지니어를 찾고 고용하는 것이 지속적인 골칫거리라고 말했습니다.
이 지역에서 자동화된 통화(automated calls)에서 우리가 본 지연 시간(latency)과 지터(jitter)는 터무니없었습니다. 만약 우리가 오케스트레이터(orchestrators)가 되었다면, 이 지역 외부에 호스팅된 대규모 모델(large models)을 사용해야 했을 수도 있고, 이는 더 높은 지연 시간으로 이어졌을 것입니다. 우리는 이것이 작동하려면 매우 작은 모델(small models)을 사용하고 모든 단계에서 지연 시간을 줄여야 한다는 것을 깨달았습니다.
Odemuyiwa는 TechCrunch에 회사의 자체 모델과 오케스트레이션 레이어(orchestration layer)를 구축하기로 한 결정에 대해 이렇게 말했습니다.
최신 모델(models)을 배포하는 AI 연구소(AI labs)는 일반적으로 모델 훈련(training) 및 데이터 확보(acquiring data)에 수백만 달러를 지출합니다. AethexAI는 두 가지 모두에 대한 해결책을 찾았습니다. 가능한 가장 큰 모델을 쫓는 대신, 정확도(accuracy)를 유지하면서 지연 시간 문제(latency problem)를 해결하기에 소형 모델로 충분하다고 판단하고, 3억에서 17억 개의 매개변수(parameters)를 가진 자체 Kora 시리즈를 개발했습니다. 이는 대규모 언어 모델(LLM) 크기의 일부에 불과하며, 이것이 바로 핵심입니다. 이 모델들을 훈련하기 위해 스타트업은 콜센터 파트너로부터 익명화된 녹음(anonymized recordings)을 사용했습니다. 또한 더 많은 오디오 데이터(audio data)를 수집하기 위해 아프리카 전역의 라디오 방송국에 하드 드라이브를 보냈습니다. 비용을 절감하기 위해 대학생들로 구성된 기여자 네트워크(contributor network)를 구축하여 데이터를 주석 처리(annotate data)하고 현지 이름을 발음하게 했습니다. 그 결과, 이 스타트업은 현재 하루 17,000건 이상의 통화를 처리하고 있다고 말합니다.
사업 측면에서, 이 회사는 음성 AI(voice AI)에 익숙하지 않은 고객들에게 프로세스를 안내하고, 현장 데모(onsite demos)와 워크숍(workshops)을 제공하여 자동화(automation)를 위한 최적의 사용 사례(use cases)를 식별하도록 돕고 있습니다.
우리는 항상 고객들에게 지금 당장 모든 사람을 위한 모든 것이 될 수는 없다고 말합니다. 우리는 작습니다. 회사와 대화를 시작할 때, 우리는 그들에게 가장 중요한 사용 사례 하나를 선택하여 시작하도록 요청합니다.
Diallo는 이렇게 말했습니다. 이 스타트업은 모든 산업 분야에서 협력할 의향이 있지만, 현재 사용 사례의 큰 부분은 채무 추심, 고객 활성화 또는 은행 및 통신사(telecoms)에서 사용하는 표준 신원 확인 절차(identity-checking process)인 KYC(KYC - 고객 알기 제도) 확인과 관련된 통화입니다. 이 회사는 현지 시장에 서비스를 제공하기 위해 계약직 현장 배치 엔지니어(forward-deployed engineers)를 고용하고 있으며, 음성 AI 통화를 위한 전화 통신(telephony)을 처리하기 위해 통신사 제공업체와 채널 파트너십(channel partnerships)을 구축하고 있습니다. 플러그 앤 플레이 솔루션(Plug-and-play solutions)은 여기서는 단순히 작동하지 않을 것이라고 회사는 말합니다.
4DX Ventures의 공동 설립자이자 매니징 파트너인 Walter Baddoo는 아프리카 및 중동 시장이 대부분의 음성 AI 기업(voice AI companies)이 서비스를 제공하기 위해 구축된 시장과는 근본적으로 다르다고 주장합니다. 그는 음성이 여전히 고객 상호 작용의 지배적인 채널이기 때문에 아프리카 및 중동의 기업들은 서구 기업들보다 약 3배 많은 통화량(call volume)을 처리한다고 말했습니다. 기존 시스템은 고급 GPU 인프라(GPU infrastructure), 표준 영어 및 유럽 음성 환경(speech environments), 그리고 미국과 유럽에서 흔한 기업 워크플로우(enterprise workflows)를 특징으로 하는 서구 시장을 위해 구축되었습니다. 이는 기업이 방언(dialects), 코드 스위칭(code-switching), 비격식적인 음성 패턴(informal speech patterns)을 처리하고 기존 전화 통신 인프라(telephony infrastructure) 및 실제 가격대 내에서 작동하는 시스템을 필요로 할 때 실제 격차를 만듭니다. 다른 말로 하면, ElevenLabs, Deepgram, Sierra, Cognigy와 같은 회사들이 빠른 속도로 전 세계적으로 확장하고 있지만, 그들이 구축된 시장과 그들이 진입하는 시장이 항상 같은 것은 아닙니다. AethexAI와 같은 스타트업들은 현지 방언(local dialects)에 특화된 모델(models), 현지 파트너십(on-the-ground partnerships), 해당 지역을 위해 구축된 인프라(infrastructure)와 같은 격차가 거대 기업들이 해소할 인센티브도 아키텍처도 없는 시장 기회를 나타낸다고 보고 있습니다.
Topics: 4DX Ventures, Africa, AI, Fundraising, Middle East, Startups, voice AI
저희 기사의 링크를 통해 구매하시면 소액의 수수료를 받을 수 있습니다. 이는 저희의 편집 독립성에 영향을 미치지 않습니다.
Ivan Mehta는 TechCrunch에서 글로벌 소비자 기술 개발을 다룹니다. 그는 인도에 거주하며 이전에 Huffington Post 및 The Next Web을 포함한 출판사에서 근무했습니다. im@ivanmehta.com으로 이메일을 보내거나 Signal에서 ivan.42로 암호화된 메시지를 통해 Ivan에게 연락하거나 연락처를 확인할 수 있습니다. 전체 약력 보기
6월 18일 로스앤젤레스 Mach Industries, Founders Fund, Shinkei Systems의 리더들로부터 성장하고 성공하는 데 필요한 것이 무엇인지 내부적으로 살펴보세요. 솔직한 대담과 영향력 있는 네트워킹을 통해 귀중한 통찰력과 새로운 인맥을 얻게 될 것입니다. 지금 등록하기
Most Popular
- Microsoft, OpenClaw에서 영감을 받은 개인 비서 Scout 출시 • Russell Brandom
- Anthropic, 상장 신청 • Kirsten Korosec
- "농담이냐": GitHub Copilot의 새로운 토큰 기반 요금 청구 방식, 개발자들 사이에서 불만 촉발 • Lucas Ropek
- Google의 24/7 AI 비서 Gemini Spark를 사용해 보니 실제로 꽤 유용하다 • Sarah Perez
- Blue Origin의 New Glenn 로켓, 플로리다 테스트 중 폭발 • Sean O Kane
- Anthropic, 새로운 동적 워크플로우 도구를 탑재한 Opus 4.8 출시 • Russell Brandom
- Waymo의 최신 로보택시, 중국산으로 수익 창출을 위해 제작되었으며 현재 승객을 받고 있다 • Kirsten Korosec
🌐 원본 출처
원문: These two founders left Goldman and Meta to build voice AI for markets everyone else overlooked - TechCrunch
출처: news.google.com
📖 원문 기사 보기🌍 글로벌 기술 뉴스
해외 최신 기술 동향을 정확하게 번역하여
국내 독자들에게 신속하고 정확한 정보를 전달합니다.


