2025-09-10

목차

사업 개요

Innodata Inc. (Nasdaq: INOD) (그 자회사들을 포함하여, “회사”, “Innodata”, “우리”, “당사” 또는 “자사”)는 선도적인 데이터 엔지니어링 회사입니다. 우리의 미션은 윤리적이고, 고성능의 인공지능(“AI”)의 약속을 실현하도록 세계에서 가장 명망 있는 기업들을 돕는 것으로, 이는 더 안전하고 더 번영하는 세상에 기여할 것이라고 우리는 믿습니다.

Innodata는 가장 높은 품질의 데이터를 엔지니어링하여 광범위한 산업 세그먼트 전반의 조직들이 더 똑똑한 결정을 내릴 수 있도록 한다는 단순한 아이디어에 기반하여 설립되었습니다. 오늘날, 우리는 세계에서 가장 혁신적인 기술 기업들이 미래의 AI 모델을 훈련하기 위해 사용하도록 가장 높은 품질의 데이터를 제공하고 있다고 믿습니다.

AI는 컴퓨터가 세상을 지각하고 이해할 수 있다는 약속을 지닙니다. 이는 전통적인 코딩으로는 이전에는 상상할 수도 없고 불가능했던 제품과 서비스를 가능하게 합니다. AI는 데이터로부터 학습하며, 가장 높은 성능의 AI는 가장 높은 품질의 데이터로부터 학습했을 것입니다. 우리는 35년에 걸쳐 연마해온, 일관성과 높은 정확도로 데이터를 대규모로 수집하고 주석(annotate)하는 우리의 역량을 활용함으로써 의미 있는 기여를 할 수 있다고 믿습니다.

우리는 또한 기업들이 AI를 그들의 운영과 제품에 배포하고 통합하도록 돕고 있으며, 혁신적인 AI 기반 산업 플랫폼을 제공하여, 기계가 이전에는 상상할 수 없던 방식으로 인간 활동을 보완하는 세상에 우리의 고객 비즈니스가 대비되도록 하고 있습니다.

시장 기회—AI 데이터 준비

AI 애플리케이션은 Python과 Java 같은 언어를 사용하여 컴퓨터가 무엇을 해야 하는지 알려주는 전통적 컴퓨터 애플리케이션과는 달리, 대량의 데이터를 통해 훈련됩니다. AI 애플리케이션은 일련의 회귀(regressions)를 통해 데이터로부터 학습합니다. 오늘날 가장 높은 성능의 AI 애플리케이션(예: OpenAI의 ChatGPT)은 전통적인 프로그래밍을 통해서는 결코 구축될 수 없었을 것입니다.

일부 대형 기술 회사들의 데이터 과학 팀은 사용자 프롬프트에 대한 응답으로 고품질의 텍스트, 코드, 이미지 등을 생성하는 생성형 AI 기술의 개발을 가속화하고 있습니다. 그 핵심에는, 수십억 개의 파라미터를 가진 딥 뉴럴 네트워크(인공지능 아키텍처)로서 방대한 양의 훈련 데이터를 필요로 하여 인간 언어의 본질을 인코딩하는 대규모 언어 모델(LLM)이 있습니다. 이들은 특화된 작업과 도메인에 적합하도록, 환각(이러한 모델이 즉흥적으로 지어내는 경향)을 통제하고, 안전하지 않거나 편향된 결과를 생성할 위험을 최소화하기 위해 감독 학습(supervised learning)과 인간 피드백으로부터의 강화 학습(RLHF)을 통한 미세조정(fine-tuning)을 필요로 합니다.

또한, 산업 수직군 전반의 기업들은 자율주행차, 감시 시스템, 자동화된 의료 진단, 디지털 비서, 챗봇, 콘텐츠 중재, 로보틱스, 사기 탐지 및 계약 검토 등 점점 증가하는 다양한 사용 사례를 위한 AI 기반 애플리케이션을 개발하려고 하고 있습니다.

고품질 훈련 데이터를 개발하는 것은 AI가 올바르게 성능을 내도록 하는 데 핵심적이지만, 종종 데이터 과학 팀에 부족한 기술과 숙련된 인적 자원이 요구됩니다. 더욱이, 고품질 데이터를 개발하는 데는 대부분의 AI 및 ML 프로젝트에서 시간의 80%가 소요됩니다.1

1 Data Preparation & Labeling for AI 2020, Cognilytica Research (Jan. 2020)

데이터 과학 팀들은 대규모이면서도 높은 품질로 이러한 데이터 준비 기능을 수행하고, 비용을 최소화하기 위해 자동화 도구를 사용하는 파트너를 찾습니다. AI 프로젝트가 보다 전문화되고 미션 크리티컬해지며 데이터 준비가 점점 더 복잡해짐에 따라, 데이터 과학 팀들은 깊은 도메인 지식과 데이터 보안이 보장되는 인프라를 갖춘 파트너를 찾습니다.

우리는 Innodata가 데이터 과학 팀과 파트너 관계를 맺기에 이상적으로 위치해 있다고 믿습니다.

2024년에 우리는 생성형 AI 파운데이션 모델을 구축하려는 여러 세계적 대형 기술 기업들과의 기존 관계를 확장하고 새로운 관계를 구축했습니다. 이러한 기업들을 위해, 우리는 이제 LLM이 프롬프트를 이해하고, 지시를 수용하고, 대화하고, 겉보기에 추론하며, 우리 중 많은 이들이 이제 경험한 놀라운 위업을 수행하도록 미세조정하는 데 필요한 지시 데이터 세트를 제공하는 등, 다양한 규모화된 데이터 솔루션과 서비스를 제공하고 있거나 제공할 태세입니다. 우리는 또한 유해성, 편향 및 해로운 응답에 대한 가드레일을 제공하는 데 핵심적인 강화 학습 및 보상 모델링, 그리고 모델 평가 서비스를 제공합니다.

소셜 미디어 회사, 금융 서비스 회사 및 많은 다른 기업들을 위해, 우리는 이미지, 텍스트, 비디오, 오디오, 코드 및 센서 데이터로 작업하는 AI 알고리즘을 위해 훈련 데이터를 수집하거나 생성하고, 훈련 데이터에 주석을 달며, AI 알고리즘을 훈련합니다.

우리는 다양한 선도적 서드파티 도구, 독자적 도구 및 고객 도구를 활용합니다. 텍스트 주석을 위해, 우리는 비용을 줄이면서 산출물의 일관성과 품질을 향상시키기 위해 AI를 통합한 당사의 독자적 데이터 주석 플랫폼을 사용합니다. 우리의 독자적 데이터 주석 플랫폼은 클래식 및 생성형 AI 작업 모두에 적용되는 자동 태깅 기능을 특징으로 합니다. 우리의 플랫폼은 고품질 데이터를 생성한 35년의 역사에서 우리가 고안해낸 많은 혁신을 담고 있습니다.

또한, 실제 세계 데이터를 수집하는 것이 종종 비현실적이기 때문에(데이터 프라이버시 규정 또는 코호트 및 아웃라이어의 희소성으로 인해), 우리는 도메인 전문가와 LLM을 활용하는 기계 기술의 조합을 사용하여 실제 세계 데이터의 모든 통계적 특성을 유지하는 고품질 합성 데이터를 생성합니다.

우리는 현재, 생성형 AI 파운데이션 모델과 챗봇 지원, 안면 인식, 소셜 네트워킹, 팟캐스트, 법률 조사 및 의료 진단을 지원하는 기타 AI를 중심으로, 최종 사용자에게 제공하는 서비스를 가능하게 하고, 가속화하거나 풍부하게 하기 위해, 가장 큰 기술 회사 다섯 곳과 여러 산업 전반의 선도 브랜드들과 협력하고 있습니다.

AI 데이터 훈련 시장은 2024년에 127억 달러로 추정되며, 2034년까지 924억 달러에 이를 때까지 연평균 22%의 성장률(CAGR)로 성장할 것으로 예상됩니다.2 이는 전반적인 AI 시스템 지출에서 예상되는 엄청난 성장(2028년까지 6,320억 달러, 2024-2028년 예측 기간 동안 29%의 CAGR)을 사실상 대리(proxy)합니다.3 마찬가지로, 글로벌 데이터 주석 도구 시장은 2023년에 20.2억 달러로 평가되었으며, 2032년까지 231.1억 달러에 이를 것으로 예상되며, 이는 31.1%의 CAGR입니다.4

2 Data Labeling Solution and Services Market, FactMR (Apr. 2024)
3 Worldwide Artificial Intelligence Systems Spending Guide, IDC (Aug. 2024)
4 Data Annotation Tools Market, Astute Analytica, (Nov. 2024)

AI 모델 배포 및 통합

우리는 향후 10년에 걸쳐, 거의 모든 산업이 고성능 AI 모델의 등장으로 근본적으로 재창조될 것이라고 믿습니다. 우리는 기업들이 최신 AI 기술을 활용하여 목표를 달성하도록 돕습니다. 우리는 맞춤형 AI 모델을 개발(적절한 알고리즘을 선택하고, 하이퍼파라미터를 조정하고, 모델을 훈련 및 검증하며, 필요에 따라 모델을 업데이트)합니다. 또한, 우리는 기업들이 도메인 특화 및 고객 특화 사용 사례를 해결하기 위해 우리의 독자적 모델과 서드파티 파운데이션 모델(LLM 포함)의 자체 맞춤 버전을 미세조정하도록 돕습니다.

AI 혁신의 현재 속도는 가속화되고 있습니다. 오늘 사용되는 알고리즘과 기법은 향후 몇 년 내에 구식이 될 가능성이 높습니다. 따라서, 우리는 오픈소스 또는 독점 소프트웨어 혁신을 통합할 수 있도록 우리의 솔루션과 플랫폼을 구축했습니다.

우리의 많은 고객은 집중적인 텍스트 데이터 처리 및 분석을 요구하는 제품과 솔루션을 제공합니다. 이러한 고객을 위해, AI 모델을 배포하고 통합하는 것 외에도, 우리는 종종 데이터 변환, 데이터 큐레이션, 데이터 위생, 데이터 통합, 데이터 추출, 데이터 컴플라이언스 및 마스터 데이터 관리 등 다양한 데이터 엔지니어링 지원 서비스를 제공합니다. 우리의 가장 오랜 고객들 중 다수에게, 우리는 그들의 워크플로와 디지털 운영에 지속적으로 혁신을 도입하고 모델을 배포합니다. 우리는 이러한 서비스를 개별적으로, 그리고 비즈니스 프로세스 관리(BPM) 약정과 결합하여 제공합니다.

우리의 고객은 다양한 산업과 광범위한 AI 사용 사례에 걸쳐 있으며, 우리의 AI 솔루션과 플랫폼이 제공하는 짧은 가치 실현 시간과 높은 경제적 수익의 혜택을 누리고 있습니다.

문서 분석 시장—전반적 AI 시장의 하위 집합—은 2024년 19.9억 달러에서 2033년까지 499.5억 달러로, 43.1%의 CAGR로 성장할 것으로 예상됩니다.5 한편, 전반적 엔터프라이즈 AI 지출은 2024년 145.3억 달러에서 2034년 5,607.4억 달러에 이를 것으로 예상되며, 44.1%의 CAGR을 기록합니다.6

5 Document Analysis Market Report Overview, Business Research Insights (Feb. 2025)
6 Enterprise Artificial Intelligence (AI) Market, Precedence Research (Nov. 2024)

AI 기반 산업 플랫폼

우리의 AI 기반 산업 플랫폼은 우리가 AI/ML 기술로 혁신할 수 있다고 믿는 특정한 틈새 시장 요구를 해결합니다. 우리는 이러한 산업 플랫폼을 소프트웨어-서비스(SaaS) 및 매니지드 서비스로 배포합니다. 이러한 플랫폼은 우리의 기술 인프라, 산업별 지식, 강력한 고객 관계 및 고객의 비즈니스 프로세스와 기술을 결합한 경험의 혜택을 받습니다. 현재까지, 우리는 의료 기록 데이터 추출 및 변환을 위한 산업 플랫폼(“Synodex®”으로 브랜드)과 홍보(PR)를 위한 산업 플랫폼(“Agility PR Solutions”으로 브랜드)을 구축했습니다. 우리는 금융 서비스 기관을 지원하기 위한 추가 AI 기반 산업 플랫폼을 개발 중입니다.

우리의 Synodex 산업 플랫폼은 의료 기록을 사용 가능한 디지털 데이터로 변환하여, 우리의 독자적 데이터 모델 또는 고객 데이터 모델에 따라 구성합니다. 2024년 말 기준으로, 우리는 Synodex 플랫폼을 활용하는 15명의 고객을 보유했습니다. 우리가 플랫폼에 AI를 더욱 통합함에 따라, 우리는 방대한 양의 환자 데이터를 검색, 분석 및 해석하고, 임상 문서화를 개선하며, 컴퓨터 보조 코딩을 더 효율적으로 만들고자 하는 요구가 증가하는 헬스케어 부문의 요구를 해결하는 것을 목표로 합니다. 글로벌 의료 분야의 인공지능(AI) 시장은 2022년 163억 달러에서 2029년 1,735.5억 달러의 시장 규모에 도달할 것으로 예측되며, 40.2%의 CAGR을 기록합니다.7

우리의 Agility 산업 플랫폼은 마케팅 커뮤니케이션 및 홍보 전문가에게 전 세계의 기자 및 소셜 미디어 인플루언서를 대상으로 콘텐츠를 타게팅하고 배포하며, 글로벌 뉴스(인쇄, 웹, 라디오 및 TV)와 소셜 미디어를 모니터링 및 분석할 수 있는 능력을 제공합니다. Agility는 이제 소프트웨어 리뷰 사이트 G2 Crowd에 의해, 결합 매출이 10억 달러를 초과하는 두 개의 가장 큰 경쟁자보다 고객 요구 사항을 더 잘 충족하는 것으로 평가되고 있습니다.8 Agility는 105.7억 달러 규모의 미디어 인텔리전스 및 PR 소프트웨어 시장에서 운영됩니다.9

7 Artificial Intelligence In Healthcare Market, Binariks. (Aug. 2024)
8 https://469676.fs1.hubspotusercontent-na1.net/hubfs/469676/Agility%20PR%20Solutions/G2/AgilityPRSolutions-G2Comparison-Feb-21-2025-1.pdf
9 Media Intelligence and PR Software Market Size and Forecast, Verified Market Research, (Mar. 2024)

회사의 운영은 현재 디지털 데이터 솔루션(DDS), Synodex 및 Agility의 세 가지 보고 세그먼트로 분류되고 보고됩니다.

경쟁적 강점

우리의 데이터 품질

우리는 우리의 기술, 대규모 인적 전문가 집단, 그리고 수년간 가장 까다로운 고객들에게 고품질 데이터를 제공하며 구축해 온 문화를 활용함으로써 업계 선도적 데이터 품질을 달성한다고 믿습니다.

지난 9년에 걸쳐, 우리는 고도의 정확한 대규모 데이터를 생산하기 위해 인간 전문가와 AI를 결합하는 접근법을 설계하고 정제해 왔습니다. 우리의 접근법에서, AI 네트워크는 요구되는 처리의 많은 부분을 자동으로 수행하고, 인간 전문가는 AI가 높은 신뢰 수준에서 수행할 수 없는 처리를 수행합니다. 인간의 산출물은 AI 네트워크로 피드백되며, 그 결과 AI는 시간이 지남에 따라 “학습”하고 “더 똑똑해져”, 최고 수준의 품질을 유지하면서 점진적으로 더 높은 수준의 자동화를 달성합니다. (아래 “우리의 기술” 참조.)

우리의 6,000명 이상의 전문가들은 다양한 데이터 도메인에서 깊은 도메인 지식을 보유하고 있습니다. 그들은 데이터 감각, 분석 능력, 그리고 깊은 도메인 숙련도를 기준으로 선발됩니다. (아래 “우리의 글로벌 딜리버리 프레임워크” 참조.)

우리의 품질 문화는 높은 데이터 품질을 달성하고 유지하는 데 중요합니다. 우리의 문화는 선도적 글로벌 정보 기업 네 곳을 포함한 세계에서 가장 성공적인 많은 회사들을 오랜 기간 지원하면서 데이터 관련 작업을 수행해 온 수십 년의 경험을 통해 배양되었습니다. 이들 네 곳과는 10년 이상 관계를 유지하며 그들의 선도 데이터 제품 다수를 구축하고 유지해 왔습니다.

우리는 ISO 9001:2008 품질 경영 시스템 표준을 준수하는 독립적인 품질 보증 센터를 유지하고 있습니다.

우리의 글로벌 딜리버리 프레임워크

우리는 31개국에 걸쳐 6,000명 이상의 직원과 연계 인력을 보유하고 있습니다. 이들 중 다수는 법률, 과학, 건강, 금융 및 기술 등 다양한 분야의 데이터 도메인 전문 지식을 보유하고 있으며, 고급 학위를 보유하고 있습니다. 우리는 또한 우리의 데이터베이스에 유지되는 대규모 원격 직원 및 프리랜서 풀에 접근할 수 있습니다. 우리의 딜리버리 거점은 다양한 시간대와 40개 이상의 언어에 걸친 다양한 인재 기반에 접근할 수 있도록 전략적으로 위치해 있습니다.

우리는 원격 직원 및 프리랜서를 관리하는 데 특화된 독자적 자원 관리 플랫폼 구축에도 투자해 왔습니다. 글로벌 팬데믹 이전에는, 우리의 운영 모델은 대형 생산 센터에서 근무하는 정규직 직원을 거의 독점적으로 사용하는 것이었습니다. 원격 근무로 전환할 필요에 의해 추진되어, 현재 우리는 약 75%가 클라우드 기반 및 원격으로 운영되고 있으며, 이는 고정 운영 비용을 낮추고 더 큰 확장성을 달성하는 데 도움이 되었습니다.

우리의 기술

지난 9년에 걸쳐, 우리는 복잡한 데이터 주석 및 기타 데이터 엔지니어링 작업을 자동화하는 기술 인프라를 구축했습니다. 우리의 기술 인프라는 고급 데이터 플로우, 오케스트레이션 및 인지 처리, 그리고 인간 전문가가 사용하는 목적 구축 애플리케이션(“워크벤치”라 부름)을 결합합니다. 이 인프라는 인간 전문가로부터 지속적으로 학습하면서 품질을 훼손하지 않고 점점 더 높은 수준의 효율성으로 데이터 주석 및 기타 데이터 엔지니어링 작업을 수행할 수 있게 합니다. 우리의 워크벤치는 인간 전문가의 불일치를 탐지하고 LLM 환각과 같은 어려운 자동 주석 오류를 포착하기 위한 데이터 검증 및 확인 알고리즘을 통합합니다.

우리의 독자적, 최첨단 Goldengate 플랫폼은 우리의 핵심 AI 기술 스택입니다. Goldengate는 비정형 데이터를 수집(ingest)하고 일련의 인지 작업을 수행하여 사람들이 추론을 생성하고 분석 애플리케이션을 구동하는 데 사용할 수 있는 분석 데이터를 생성합니다. 이는 트랜스퍼 러닝을 갖춘 로우코드 AI를 제공하며, 우리가 지난 9년 동안 산업용 딥 뉴럴 네트워크를 배포하면서 개발한 생성형 LLM과 딥러닝 기반 시퀀스 라벨링 모델 및 서드파티 파운데이션 모델을 오케스트레이션합니다. 이는 애플리케이션 프로그래밍 인터페이스(“API”)를 통해 우리의 내부 시스템과 고객 환경 모두와 통합됩니다.

오늘날, Goldengate는 고객을 위해 수행하는 특정 AI 프로젝트의 기반 기술로써, 그리고 우리의 데이터 주석, 문서 인텔리전스 및 규제 변경 관리 플랫폼을 구동하는 ‘후드 아래의 AI’로서 역할을 합니다. 이 플랫폼의 주요 이점 중 하나는 “로우코드”라는 점으로, 다수의 데이터 과학자를 필요로 하지 않으며, 모델을 구축하거나 모델을 오케스트레이션하고 업데이트하기 위한 데이터 과학 플랫폼을 필요로 하지 않습니다. Goldengate를 우리의 SME들과 결합하여 사용함으로써, 우리는 실제 세계 문제를 해결하는 고성능, 최첨단 모델을 구축할 수 있습니다.

우리의 Agility 산업 플랫폼을 지원하기 위해, 우리는 24/7 기준으로 글로벌 고객에게 SaaS 경험을 제공하는 완전 확장형 클라우드 기반 인프라를 구축했습니다. 여기에는 (i) 연간 20억 개의 미디어 항목을 인덱싱하여 미디어 모니터링, 미디어 보강 및 미디어 데이터베이스 API를 지원하는 AI/ML 기반 빅데이터 미디어 인텔리전스 플랫폼; (ii) 미디어 타게팅, 콘텐츠 큐레이션, 콘텐츠 배포, 통합 뉴스와이어 및 뉴스룸을 통합하는 전체 타게팅 워크플로 플랫폼; (iii) 100만 명 이상의 글로벌 미디어 인플루언서와 기자의 포괄적 데이터베이스; (iv) 미디어 모니터링 및 분석 엔진; 그리고 (v) 우리의 데이터베이스의 발견 및 유지 관리를 위한 연구 워크플로를 간소화하기 위해 AI와 머신러닝을 결합하는 미디어 데이터베이스 연구용 워크플로 플랫폼이 포함됩니다.

2023년 1월, 우리는 Agility 제품 내에 PR CoPilot™이라는 모듈을 출시했으며, 이는 커뮤니케이션 전문가들이 보도자료 및 미디어 아웃리치를 생성하는 작업을 보강합니다. 이는 독자적 Innodata 기술과 OpenAI의 GPT 대규모 언어 모델을 활용합니다. 우리는 PR CoPilot이 완전히 통합된 PR 플랫폼에 네이티브로 구축된 최초의 AI 글쓰기 보조도구라고 믿습니다.

우리의 Synodex 산업 플랫폼을 지원하기 위해, 우리는 이미지 형태의 의료 기록과 HL7/FHIR 전자 건강 기록(EHR) 시스템을, 질병과 장애, 진단 검사 및 약리학을 아우르고 ICD-10과 같은 산업 표준 코드를 지원하며 디지털 데이터를 처리, 분석 및 표시하기 위한 규칙 엔진을 포함하는 독자적 보험 의료 데이터 사전에 부합하는 디지털 데이터로 변환하는 기술을 구축했습니다.

우리의 인프라

우리의 인프라는 데이터 보안, 컴플라이언스, 확장성 및 신뢰성에 대한 고객 요구를 충족시키기 위한 다양한 전략을 지원합니다. 우리의 사용자 엔드포인트는 방화벽, IDS/IPS, 취약성 스캐닝 및 패치 관리 엔진으로 구성된 클라우드 관리 보안 솔루션으로 보호됩니다. 우리는 데이터 및 애플리케이션을 우리의 운영 센터에 있는 자체 데이터 센터, 고객의 데이터 센터, 그리고 무한 확장성의 IT 리소스 혜택을 제공하는 Amazon Web Services(“AWS”), Microsoft Azure(“Azure”), Oracle Cloud Infrastructure(“OCI”), Google Cloud Platform(“GCP”) 등 서드파티 클라우드 서비스에 호스팅합니다. 우리의 데이터 운영은 다중 중복 네트워크 연결로 연결됩니다. 우리의 광역 네트워크(WAN)—로컬 영역 네트워크, 스토리지 영역 네트워크, 네트워크 부착 스토리지 및 데이터 센터와 함께—는 업계 표준의 중복성으로 구성되어 있으며, 종종 24x7 가용성을 확립하기 위해 두 개 이상의 백업을 갖추고 있습니다. 2024년에, 계획된 유지보수를 제외하면 우리의 WAN 가동 시간은 99.90%였습니다. 우리는 휴지 상태와 전송 중 모두에서 모든 민감한 정보를 고급 암호화 표준(AES) 256 또는 유사 표준으로 암호화하며, 업계 선도 관리형 방화벽, 침입 탐지 및 방지 서비스를 포함한 다양한 보안 기능을 사용합니다. (아래 “정보 보안” 참조.)

당사의 역량 폭

우리는 고객의 가장 높은 니즈 지점에서 대응할 수 있습니다. 예를 들어, 우리는 복잡한 대출 계약을 관리하는 AI 애플리케이션을 구축하는 은행의 데이터 과학 팀을 위해 데이터 주석을 제공할 수 있습니다. 동일한 요구를 갖고 있으나 정교한 데이터 과학 지원에 접근할 수 없는 또 다른 은행 고객에게는, 우리는 대출 계약에서 핵심 데이터를 추출하고 표준화된 디지털 데이터를 API를 통해 은행의 기존 애플리케이션으로 출력하는, 우리의 독자적 Goldengate AI 플랫폼에 구축된 풀 AI/ML 솔루션을 제공할 수 있습니다. 또 다른 애널리틱스 애플리케이션조차 결여한 은행 고객에게는, 우리는 데이터 분석 플랫폼을 제공할 수 있습니다.

우리의 데이터 주석 서비스를 활용하는 데이터 과학 팀은 또한 데이터 변환, 데이터 큐레이션, 데이터 위생, 데이터 통합, 데이터 컴플라이언스 및 마스터 데이터 관리 등 기타 관련 니즈를 종종 갖습니다. 본질적으로 스태핑 회사인 많은 데이터 주석 경쟁업체와 달리, 풀 서비스 데이터 엔지니어링 회사로서 우리는 이러한 부수적 요구 사항을 해결할 수 있습니다.

우리의 레거시

우리는 지난 35년에 걸쳐 세계에서 가장 까다로운 정보 회사들의 고품질 데이터를 생성하면서 우리의 역량을 개발하고 접근법을 점진적으로 연마해 왔습니다. 약 9년 전, 우리는 대규모, 인간 집약적 데이터 운영에 머신러닝과 떠오르는 AI를 연구, 개발 및 적용하기 위해 연구개발 센터인 Innodata Labs를 설립했습니다. 2019년, 우리는 우리의 R&D 노력에서 나온 역량을 포장하기 시작하여, 몇몇 고성장 신시장과 정렬하고 기업들이 AI/ML을 사용하여 성과 이익 및 비즈니스 인사이트를 추진하도록 돕기 시작했습니다.

고품질 데이터에서의 우리의 역사적 핵심 역량과, 적용 AI에서의 이러한 R&D 노력이 결합되어, 우리의 제공물—AI 데이터 준비, AI 모델 배포 및 통합, AI 기반 산업 플랫폼—의 진화를 위한 토대를 만들었습니다.

우리의 문화

우리는 많은 세계적 성공 기업들이 우리의 데이터 니즈를 신뢰하는 가운데, 그들을 수십 년 동안 지원해 온 경험을 바탕으로 강한 고객 및 품질 중심의 문화를 개발해 왔습니다. 우리는 정직하고, 투명하며, 폭넓은 커뮤니케이션을 믿습니다. 우리는 기술이 인간의 주도성과 재능을 보완하는 약속에 대해 낙관적입니다. 우리는 다양성을 포용하며 고객 및 동료와의 관계에서 공감과 존중을 중시하는 동시에, 고객의 최적 비즈니스 성과를 가장 잘 촉진하는 직설적 커뮤니케이션을 다듬습니다. 우리는 우리의 문화가 고객을 가장 잘 서비스하도록 돕고 최고의 인재를 유치하고 유지하도록 돕는다고 믿습니다.

성장 전략

우리는 우리가 독특한 시기에 살고 있다고 믿습니다—AI가 곧 우리의 컴퓨터, 로봇 및 자동차의 “두뇌”가 될 것이며; 그리고 AI가 수천 개의 기업에 의해, 전통적 코딩으로는 불가능했던 서비스와 제품을 제공하기 위해 채택될 것입니다.

AI에서, 소프트웨어는 대량의 데이터로부터 학습함으로써 스스로를 작성합니다. “Garbage in, garbage out(쓰레기가 들어가면 쓰레기가 나온다)”라는 문구가 더 잘 적용되는 곳은 없습니다. 일관되고 고품질의 데이터 수집 및 주석을 위한 데이터 중심 접근법이 승자와 패자를 가를 것입니다.

우리의 성장 전략은 고품질 데이터를 생성한 35년 이상의 경험을 활용하는 것입니다. 우리는 점점 더 정교해지는 AI의 생성과 상업화 및 비즈니스에서의 AI 배포와 관련된 크고 역동적이며 빠르게 성장하는 시장과 정렬하고 이를 서비스할 의도입니다. 우리의 솔루션과 플랫폼은 지난 35년에 걸쳐 개발한 기술, 인적 자원 및 데이터 품질에 대한 광적인 문화와, 지난 9년에 걸쳐 투자한 AI/ML 연구개발을 활용합니다.

우리 성장 전략의 핵심 요소는 다음을 포함합니다:

새로운 고객 확보 주도

우리는 여전히 우리의 가용 시장을 관통하는 초기 단계에 있다고 믿습니다. 우리는 특히 AI 혁신에 큰 투자와 성장을 지속하는 고객과의 새로운 장기 전략적 고객 관계를 추구하려 하며, 여기서 우리는 우리의 광범위한 역량을 제공하고 의미 있는 영향을 미칠 수 있습니다.

우리는 영업 인재를 채용하고 유지하고 데이터 중심 영업 조직을 구축하는 데 집중하고 있습니다. 현재의 영업 조직은 잘 운영되고 있으며, 단기 성장 목표를 달성할 수 있게 해 줄 것으로 믿습니다.

기존 고객과의 관계 확대

우리는 고객 계정 내에서 “랜드-앤-익스팬드”를 명확히 수행할 수 있는 능력을 입증해 왔다고 믿습니다. 일단 특정 사업부와 특정 사용 사례 내에서 고객과 협업을 시작하면, 그리고 고객이 우리와 협업하는 이점을 경험하면, 종종 우리를 위한 사용 사례의 수를 늘리고 추가 사업부로 확장합니다.

새로운 역량의 지속적 개발

우리는 떠오르는 고객 니즈와 AI 기술의 진전에 맞춰 설계된 새로운 역량을 개발하려는 의도입니다. 우리는 세계 최대 은행 중 하나와의 진행 중인 관계처럼, AI 기반 컴플라이언스 플랫폼을 공동 개발하기 위한 추가 차터 고객 관계를 개발하려 합니다.

지속적 혁신

우리는 혁신 능력이 우리의 성장과 시장 견인력에 계속 중요한 기여를 할 것이라고 믿습니다. 우리는 고객과 긴밀히 협력하여, 기존 역량과 새로운 역량에 대한 개선 요구를 평가하고 그들을 더 잘 서비스하는 것을 목표로 합니다. 우리는 우리의 AI 산업 플랫폼을 위한 잘 정의된 로드맵을 보유하고 있으며, 이는 잠재적 신규 고객에게 플랫폼의 매력을 넓히고 기존 고객과의 추가 확장 기회를 증가시켜 성장을 창출할 수 있다고 믿는 새로운 기능과 기능을 도입합니다.

우리는 이러한 성장 투자를 내부 자원으로 자금 조달할 것으로 예상하며, 부채 또는 지분 조달을 통해 자본에 접근할 수 있습니다.

주요 고객

우리의 고객에는 은행, 보험, 금융 서비스, 기술, 디지털 리테일링 및 정보/미디어를 포함한 여러 수직군에 걸친 주요 기업이 포함됩니다. DDS 세그먼트의 한 고객은 2024년 12월 31일 종료 회계연도에 회사 총매출의 약 48%를 창출했습니다. 또 다른 DDS 세그먼트의 고객은 2023년 12월 31일 종료 회계연도에 회사 총매출의 약 10%를 창출했습니다. 이러한 기간 동안 다른 어떤 고객도 총매출의 10% 이상을 차지하지 않았습니다. 또한, 2024년 및 2023년 종료 연도에, 비미국 고객으로부터의 매출은 각각 회사 매출의 21% 및 37%를 차지했습니다.

우리는 많은 고객과 오랜 관계를 유지하고 있습니다. 고품질 서비스를 제공한 우리의 실적은 고객 관계를 공고히 하는 데 도움을 줍니다. 우리의 많은 고객은 반복 고객이며, 이는 우리가 그들과의 초기 약정 이후 추가 프로젝트를 제공받아 왔음을 의미합니다.

우리의 고객과의 계약은 많은 경우 30일에서 90일의 통지로 해지 가능합니다. 우리가 고객에게 제공하는 서비스의 상당 부분은 고객의 요구 사항에 따릅니다.

영업 및 마케팅

우리는 주로 미국, 캐나다, 영국 및 유럽의 여러 위치에서 운영하는 전문가, 고위 경영진 및 직접 영업 인력을 통해 우리의 솔루션과 플랫폼을 직접 마케팅하고 판매합니다. 또한, 우리는 신규 및 기존 고객의 구축과 개발을 위해 전략적 파트너십과 채널 관계의 사용을 점점 더 개발하고 확대하고 있습니다.

우리의 임원급 비즈니스 개발 전문가와 영업 및 마케팅 인력 외에도, 우리는 신규 고객과 신규 고객 참여의 개발을 지원하는 솔루션 아키텍트, 기술 지원 전문가 및 컨설턴트를 배치합니다. 이러한 리소스는 고객을 지원하기 위해 영구적 팀과 애드혹 팀에서 활동합니다.

우리의 마케팅 부서와 영업 전문가들은 리드 생성에 함께 작업합니다. 우리의 영업 전문가는 잠재 고객을 식별하고 자격을 부여하며, 기존 및 잠재 고객의 의사 결정자에게 직접적이고 개인적인 접근을 확보합니다. 그들은 고객 인력과 우리 서비스 팀 사이의 상호작용을 촉진하여, 우리가 고객의 목표를 지원할 수 있는 방법을 정의합니다. 각 잠재 고객 참여에 대해, 우리는 회사 내 다양한 분야에서 선임 직원들로 구성된 팀을 구성합니다. 팀 구성원들은 공식화된 프로세스에서 지정된 역할을 맡고, 결합된 지식과 경험을 사용하여 고객의 목표를 이해하고 고객과 솔루션을 협업합니다.

우리의 마케팅 조직은 우리의 브랜드와 서비스 제공물의 가시성과 인지도를 개발 및 증가시키고, 우리의 가치 제안을 정의하고 커뮤니케이션하며, 자격 있는 초기 단계 리드를 생성하고, 효과적인 영업 지원 도구를 제공하는 데 책임이 있습니다.

우리의 마케팅 전략의 일환으로, 우리는 인지도를 구축하고, 업계 사상 리더로서의 명성을 확립하며, 리드를 생성하기 위해 미디어 조직과 파트너십을 맺습니다. 미디어 파트너에는 무역 협회 및 출판물, 무역 박람회 주최자 및 컨설팅 조직이 포함됩니다. 이러한 파트너십은 우리가 디지털 콘텐츠 리더 및 의사 결정자 사이에서 존재감을 구축함에 따라 엔터프라이즈 산업에서 특히 가치가 있습니다.

주요 마케팅 아웃리치 활동에는 콘텐츠 마케팅, 이벤트 마케팅(무역 박람회, 가상 서밋, 컨퍼런스 및 세미나에서의 전시 포함), 직접 및 데이터베이스 마케팅, 홍보 및 미디어 관계(연설 참여 포함), 그리고 웹 마케팅(통합 마케팅 캠페인, 검색 엔진 최적화, 검색 엔진 마케팅 및 외부 웹사이트의 유지 및 지속적 개발 포함)이 포함됩니다.

영업 활동에는 리드 생성, 리드 육성, 잠재 고객과의 논의를 통해 그들의 니즈를 이해하는 것, 우리의 제품 시연, 솔루션 설계, 제안 요청에 대한 응답, 계정 및 고객 관계 및 활동 관리가 포함됩니다.

우리의 솔루션 분석 그룹, 고객 서비스 그룹 및 엔지니어링 서비스 그룹의 인력은 우리 직접 영업 노력을 긴밀히 지원합니다. 이들은 고객의 기술적 니즈를 이해하고, 시연, 프로토타입, 가격 견적 및 시간 추정을 포함하여 이러한 니즈에 대한 응답을 제공하는 데 영업 팀을 지원합니다. 또한, 고객 서비스 그룹의 계정 관리자는 고객에게 지속적인 프로젝트 수준 지원을 제공함으로써 우리의 직접 영업 노력을 지원합니다.

경쟁

산업 수직군 전반의 주요 경쟁자는 Appen, CloudFactory, Surge AI, Invisible Technologies, Turing Defined Crowd, Deepen.ai, Telus, Samasource 및 Scale AI 등이며, 이들 중 다수는 확립된 고객 기반을 가진 대형 기업입니다. 또한 Cognizant Technology Solutions, ExlService Holdings, Inc., Genpact Limited, Infosys 및 Tata Consultancy Services와 같은 기술 서비스 제공업체도 있습니다.

우리는 우리의 기술 플랫폼, IT 인프라, 오프쇼어 도메인 전문가 및 규모의 경제를 활용한, 고품질이면서 경쟁력 있는 가격의 솔루션을 제공함으로써 경쟁합니다. 우리의 경쟁적 이점은 특히 복잡하고, 미션 크리티컬하며, 범위 또는 규모가 큰 과업이나 높은 수준의 정보 보안을 요구하는 고객에게 매력적입니다.

우리의 각 산업 플랫폼은 고유한 경쟁자 집합을 가집니다. 우리의 Synodex 산업 플랫폼의 주요 경쟁자는 Risk Righter, eNoah, Digital Owl, Human API, EIS, Release Point, Claretto, Parameds 및 일부 BPO 회사이며, 이들 중 다수는 확립된 고객 기반을 가진 대형 기업입니다. 또한 우리는 현재 또는 잠재 고객의 사내 인력과도 경쟁하는데, 이들은 우리의 서비스를 사내에서 복제하려 하거나 니즈를 충족하기 위해 대체 접근법을 사용할 수 있습니다.

우리의 Agility 산업 플랫폼은 Meltwater, Cision, Muck Rack, Onclusive 및 Intrado와 경쟁하며, 이들 중 다수는 확립된 고객 기반을 가진 대형 기업입니다. 우리의 경쟁자에는 미디어 모니터링 및 분석 서비스를 제공하고 기자 및 인플루언서 데이터베이스를 제공하는 PR 회사도 포함됩니다. 우리의 경쟁자에는 소셜 미디어 리스닝 회사 및 소셜 미디어 인플루언서를 타게팅하여 메시지를 증폭하는 플랫폼을 제공하는 스타트업도 포함됩니다.

지적 재산권

우리는 독자적 Goldengate AI 플랫폼, 다양한 플랫폼 적용, 독자적 데이터 모델 및 기타 지적 재산권을 포함한 독자적 기술과 방법론에 부분적으로 의존합니다. 우리는 특허를 보유하고 있으며, 이 특허의 기간이 그 적용의 예상 수명에 비해 적절하다고 믿습니다. 우리는 영업비밀, 라이선스, 비공개 및 기타 계약과 저작권 및 상표법의 조합에 의존하여 우리의 지적 재산권을 보호합니다.

우리는 직원, 계약자 및 고객과 비밀 유지 계약을 체결하며, 우리의 독자적 정보와 고객의 독자적 정보에 대한 접근 및 배포를 제한합니다. 이러한 조치가 우리의 독자적 정보의 부정사용을 억지하는 데 충분하거나 효과적일 것이라고 보장할 수 없으며, 무단 사용을 탐지하고 적절한 조치를 취하여 우리의 지적 재산권을 집행할 수 있을 것이라고 보장할 수 없습니다.

정보 보안

아시아의 우리의 운영 시설과 미국 뉴저지 시설은 정보 보안 관리 표준—ISO 27001:2022—에 인증되어 있습니다. 우리는 이중 인증(2FA)을 통한 향상된 접근 보안, 시의적절한 소프트웨어 업데이트 및 보안 수정을 위한 중앙 집중식 패치 관리, 모바일 및 민감한 엔드포인트를 위한 전체 디스크 암호화, 통합 방화벽 및 IDS/IPS 기능을 갖춘 고급 안티바이러스 보호, 그리고 경계 네트워크 계층에서 정보 자산을 보호하고 네트워크 트래픽을 모니터링하기 위한 침입 탐지 및 방지 시스템(IDS/IPS)을 갖춘 차세대 방화벽 등 광범위한 보안 통제를 구현하는 다층 보안 접근법을 유지합니다.

HIPAA가 적용되는 개인 식별 정보(PII)를 처리하기 위해, 우리는 데이터 유휴 및 전송 시 보안을 위해 AES-256 암호화(또는 동등)를 통합한 미국 기반의 코로케이션 데이터 센터 또는 HIPAA 준수 클라우드 인프라를 활용합니다. 우리의 보안 태세는 매년 감사됩니다.

정부 규제

우리는 프라이버시 및 데이터 보호를 포함한 우리의 비즈니스와 관련된 여러 미국 연방 및 주, 그리고 해외 법률 및 규정의 적용을 받습니다. 우리는 미국 1996년 건강보험 양도 및 책임에 관한 법(HIPAA) 및 그 개정(건강 정보 기술을 위한 경제 및 임상 건강법(HITECH) 포함), 영국의 일반 데이터 보호 규정(2018년 데이터 보호법에 의해 조정), EU 일반 데이터 보호 규정, 그리고 해당되는 경우 데이터 프라이버시를 규제하는 현지 법을 준수합니다.

연구 및 개발

우리의 Innodata Labs는 우리가 운영과 고객과 함께 활용하는 AI 기반 기술을 연구 및 개발합니다. Innodata Labs 팀은 데이터 엔티티 추출 등 데이터 과학의 분리된 주제에 관한 선도적 논문을 발표하고 데이터 과학, 법, 비즈니스, 기술, 의학, 사회과학 등 분야의 박사 학위를 취득한 데이터 과학자를 포함합니다.

우리의 제품 엔지니어링 팀도 우리의 AI 산업 플랫폼의 기능과 유용성을 향상시키고, 새로운 사용 사례를 해결하며, 추가 혁신 기술을 개발하는 데 초점을 맞춘 연구개발 노력을 수행합니다. 기존 및 새로운 사용 사례를 지원하기 위한 새로운 기능의 적시 개발은 우리의 경쟁적 위치를 유지하는 데 필수적이며, 우리는 정기적으로 소프트웨어의 새로운 버전을 출시합니다.

고객 피드백은 우리가 고객의 우선순위에 정렬되고 시장 니즈를 앞서 나가도록 보장하는 데 도움을 줍니다. 우리의 혁신 문화는 높은 동기 부여를 받은 AI 전문가 및 기술자 팀을 유치하고 유지하는 데 도움을 줍니다. 우리의 연구개발 센터는 북미와 아시아-태평양 전역의 여러 지리적 위치에 걸쳐 있습니다.

2022년 중반, 우리는 혁신 이니셔티브를 통해 성장을 주도하고 윤리적 AI와 AI 기술의 미래와 관련된 대화를 발전시키는 데 전념하는 자문위원회를 구성했습니다. 현재 Microsoft의 최고 데이터 책임자(Chief Data Officer)가 우리의 유일한 자문위원으로 활동하고 있습니다. 우리는 때때로 자문위원회에 추가 구성원을 고려할 가능성이 높습니다.

환경, 사회 및 지배구조

우리는 사회적 책임; 환경의 관리자로서의 우리의 수행 개선; 그리고 지속 가능성에 초점을 맞춘 견고한 기업 ESG 프로그램을 구축했습니다.

사회적 책임

우리는 윤리적 AI와 AI 혜택에 대한 광범위한 접근으로부터 발생할 수 있는 광범위하게 분포된, 지속 가능한 번영의 미래를 육성하려는 비전에 영감을 받습니다. 우리는 2016년에 i-Hope 프로그램을 시작하여, 주변화되거나 경제적으로 불리한 커뮤니티의 아이들이 점점 AI로 구동되는 세상의 도전에 직면하도록 돕고자 했습니다. 2025년까지 25,000명의 아이들에게 컴퓨터 리터러시의 선물을 제공한다는 우리의 목표는 2023년 3분기에 예정보다 앞서 달성되었습니다. 이 이니셔티브의 일환으로, 우리의 운영 자회사 중 하나는 필리핀의 공공 자금 고등 교육 기관에 스마트 교실, 아이디에이션 룸, 80,000권 이상의 책이 있는 오픈 라이브러리를 인도했습니다.

2016년 이후 우리는 이와 다른 기업의 사회적 책임(CSR) 프로그램에 3,700 인일 이상의 기여를 했습니다. 우리는 인도, 스리랑카 및 필리핀 전역에 24개의 완전 기능 컴퓨터 랩과 스마트 교실을 구축하고 운영에 들어갔습니다. 그 결과, 약 42,500명의 아이들이 기술 숙련도를 높였고 AI 시대의 기회를 포착할 수 있게 더 잘 준비되었습니다.

우리의 기여는 잘 인정받았습니다. 2024년에 우리의 운영 자회사를 통해 받은 수상 인정의 예로는, 아시아 CEO 어워즈-2024에서 네 번째로 CSR 올해의 회사(Circle of Excellence Award) 수상; 최고의 환경 책임 이니셔티브; CSR 관행의 혁신; National CSR Leadership Congress & Awards로부터의 여성 역량 강화 이니셔티브; World Sustainability Congress로부터의 지속 가능한 다양성, 형평성 및 포용 수상 등이 있습니다.

환경 관리

우리는 또한 우리의 비즈니스를 기후 변화 완화에 대한 글로벌 노력을 지원하는 환경적으로 책임 있는 방식으로 수행하는 데 전념합니다. 우리의 탄소 발자국을 최소화하고, 자원을 보존하며, 지속 가능성을 촉진하는 관행을 구현함으로써, 우리는 환경에 긍정적인 힘이 되고자 합니다.

우리는 생산 시설의 온실 가스 배출, 에너지 소비 및 물 사용을 모니터링하고 감축 목표를 설정합니다. 이러한 데이터 중심 접근은 우리의 지속 가능성 이니셔티브를 개선하고 고객과 스코프 1, 2, 3 배출 데이터를 공유할 수 있게 해 주었습니다.

우리의 글로벌 운영 전반에 걸쳐, 우리는 전자 폐기물 및 종이를 재활용합니다. 인도, 필리핀 및 스리랑카에서, 우리는 우리가 운영하는 커뮤니티의 풀뿌리 환경 보호 이니셔티브를 적극적으로 지원합니다. 2024년에 우리는 자연 보호구역에 5,800그루 이상의 묘목과 어린나무를 심었으며, 2018년 이후 누계는 11,800그루를 초과했습니다. 이 이니셔티브에는 비목의 초기 성장 단계에서 적절한 관리를 보장하여 장기 생존율을 향상시키는 후속 관행이 포함됩니다.

지속 가능성

우리의 지속 가능성 프로그램은 건강 및 안전, 비즈니스 연속성 관리, 정보 보안, 노동 기준, 뇌물 및 부패 방지, 경영 참여 및 사회적 영향이라는 다음의 핵심 요소를 기반으로 합니다. 우리의 지속 가능성 프로그램은 ISO 27001:2022(정보 보안) 인증, 정책 및 이러한 핵심 영역에 대한 직원 교육으로 뒷받침됩니다.

직원

2024년 12월 31일 기준으로, 우리는 6,648명의 직원을 고용했으며, 그 중 6,597명은 정규직이었습니다. 우리의 많은 직원은 법, 비즈니스, 기술, 의학 및 사회 과학과 같은 전문 분야에서 고급 학위를 보유하고 있습니다. 현재 노조에 의해 대표되는 직원은 없으며, 우리는 직원들과의 관계가 만족스럽다고 믿습니다.

본사

우리의 주요 본사 사무소는 뉴욕시 외곽인 뉴저지주 리지필드 파크 07660, 55 챌린저 로드에 위치해 있으며, 우리의 전화번호는 (201) 371-8000입니다. 우리는 1988년에 설립되었습니다.

우리의 웹사이트는 www.innodata.com 이며; 우리의 웹사이트에 포함된 정보는 이 연차보고서(Form 10-K)의 일부로 포함되거나, 참조로 편입되지 않습니다. 우리는 전자적으로 SEC에 자료를 제출하거나 제공한 후 합리적으로 신속하게, 우리의 Form 10-K 연차보고서, Form 10-Q 분기보고서, Form 8-K 현재보고서 및 해당 보고서에 대한 모든 개정을, 무료로 웹사이트에서 제공하고 있습니다. 우리의 SEC 보고서는 우리의 웹사이트의 투자자관계 섹션 또는 SEC의 www.sec.gov 에서 얻을 수 있습니다.

핵심 요약

관련 문서