[Phân tích] Scale AI – Hành trình phát triển, mô hình kinh doanh và bài học cho startup Việt Nam

1. Bối cảnh & Snapshot tổng quan
Scale AI, Inc. được thành lập năm 2016 bởi Alexandr Wang (bỏ học MIT) và Lucy Guo (bỏ học Carnegie Mellon)↗. Đây là startup cung cấp dịch vụ gán nhãn dữ liệu và đánh giá mô hình AI/ML, đóng vai trò như “hạ tầng thầm lặng” phía sau nhiều đột phá AI hiện nay – từ xe tự lái cho đến các mô hình ngôn ngữ lớn (LLM)↗. Sứ mệnh ban đầu của Scale AI là giải quyết “điểm nghẽn” về dữ liệu huấn luyện bằng cách kết hợp giữa sức mạnh con người và thuật toán để tạo ra bộ dữ liệu được gán nhãn chính xác cho mô hình AI↗. Công ty khởi đầu tại San Francisco và tham gia chương trình tăng tốc Y Combinator (Summer 2016).
Chỉ trong vòng 3 năm, Scale AI đã trở thành “kỳ lân” (unicorn) với mức định giá trên 1 tỷ USD sau vòng gọi vốn Series C trị giá 100 triệu USD vào tháng 8/2019 do Founders Fund dẫn dắt↗. Từ chỗ chỉ ~100 nhân viên (nhưng có tới ~30.000 cộng tác viên bên ngoài) năm 2019↗, Scale AI đã phát triển thần tốc về quy mô và giá trị. Đến tháng 5/2024, công ty huy động thêm 1 tỷ USD (Series F) nâng định giá lên 13,8 tỷ USD↗. Không dừng ở đó, tháng 6/2025, Meta Platforms chi 14,3 tỷ USD để mua 49% cổ phần không có quyền biểu quyết của Scale AI – định giá công ty ở mức khoảng 29 tỷ USD↗. Thương vụ này đưa CEO Alexandr Wang (28 tuổi) trở thành tỷ phú trẻ nhất thế giới và ông chuyển sang làm Giám đốc AI (Chief AI Officer) tại Meta, đồng thời vẫn giữ ghế trong HĐQT Scale AI↗.
Hiện tại (cuối 2025), Scale AI được coi là một trong những startup AI hạ tầng hàng đầu với khoảng 1.000 nhân viên chính thức↗ và mạng lưới 240.000 cộng tác viên gán nhãn trên toàn cầu (qua nền tảng Remotasks)↗. Doanh thu công ty tăng trưởng nhanh chóng, từ khoảng 250 triệu USD (2022) lên 760 triệu (2023) và đạt ~870 triệu USD năm 2024↗ – tuy chưa đạt mục tiêu đề ra 1 tỷ USD. Scale AI dự báo doanh thu sẽ hơn gấp đôi lên 2 tỷ USD trong năm 2025↗ nhờ làn sóng nhu cầu về dữ liệu huấn luyện AI. Với đà này, định giá công ty từng được kỳ vọng có thể chạm mốc 25 tỷ USD trong tương lai gần (trước khi Meta đầu tư)↗.
Tóm lại, trong chưa đầy 10 năm, Scale AI đã đi từ một ý tưởng khởi nghiệp của chàng sinh viên 19 tuổi thành một “đế chế” dữ liệu cho AI trị giá hàng chục tỷ USD. Công ty hoạt động theo mô hình B2B/B2G (bán giải pháp cho doanh nghiệp và chính phủ), đóng vai trò cung cấp “nhiên liệu dữ liệu” cho các dự án AI của khách hàng. Snapshot nhanh về Scale AI: trụ sở tại San Francisco, thành lập 2016; tổng vốn huy động ~16 tỷ USD; định giá đỉnh điểm ~29 tỷ USD; khách hàng gồm nhiều đại gia công nghệ (Google, Microsoft, Meta, OpenAI...), hãng ô tô, tổ chức chính phủ; doanh thu gần 1 tỷ USD/năm; và đội ngũ gán nhãn phân bổ ở nhiều nước đang phát triển. Công ty tự định vị mình là “hạ tầng nền tảng cho kỷ nguyên AI”↗ với trọng tâm đảm bảo dữ liệu đào tạo chuẩn xác cho mọi ứng dụng trí tuệ nhân tạo.
2. Sản phẩm, công nghệ & “data engine”
Sản phẩm lõi – Data Engine: Xuyên suốt hành trình, dịch vụ cốt lõi của Scale AI là nền tảng gán nhãn dữ liệu hỗ trợ bởi con người kết hợp AI, gọi là Scale Data Engine. Nền tảng này vận hành dựa trên đội ngũ ~240.000 người làm nhiệm vụ gán nhãn (chủ yếu ở các nước như Kenya, Philippines, Venezuela) do công ty con Remotasks quản lý↗. Khách hàng gửi dữ liệu thô (hình ảnh, video, văn bản, âm thanh, dữ liệu cảm biến 3D, v.v.) cho Scale AI qua API hoặc công cụ web; sau đó hệ thống sẽ phân phối các “task” cho đội ngũ người gán nhãn và/hoặc mô hình ML nội bộ để gắn nhãn phù hợp. Kết quả là bộ dữ liệu được gắn nhãn chính xác, nhất quán dùng để huấn luyện hoặc đánh giá mô hình ML của khách hàng↗. Nhiều công ty lớn như Lyft, Toyota, Airbnb, General Motors đã sử dụng dịch vụ này để có dữ liệu huấn luyện chất lượng cao↗.
Điểm độc đáo của công nghệ Scale AI là cách kết hợp linh hoạt giữa nhãn tự động bằng ML và nhãn thủ công bởi con người. Cụ thể, nền tảng cung cấp ba chế độ: (1) Tự động hoàn toàn: dùng mô hình ML tùy chỉnh của Scale để tự động gắn nhãn những trường hợp phổ biến, giúp tăng tốc độ đáng kể (nhưng đòi hỏi có sẵn dữ liệu ground-truth chất lượng cao và khó xử lý đúng edge case ngoại lệ)↗; (2) Con người hoàn toàn: do các chuyên gia gán nhãn thủ công, đảm bảo độ chính xác cao nhất cho các bài toán phức tạp (đổi lại chi phí cao hơn, tốc độ chậm hơn)↗; (3) Kết hợp người + máy (HITL): mô hình ML tự động xử lý phần lớn dữ liệu, sau đó con người kiểm tra và hiệu chỉnh những phần chưa chính xác↗. Phương pháp human-in-the-loop này tận dụng ưu điểm cả hai phía để vừa đạt quy mô, vừa giữ chất lượng tối ưu. Scale AI cho biết họ hỗ trợ gán nhãn đa dạng loại dữ liệu: từ hình ảnh, video, âm thanh, văn bản đến dữ liệu cảm biến LIDAR 3D và bản đồ – phục vụ các ứng dụng từ thị giác máy tính, NLP cho đến xe tự hành, robot, AR/VR↗.
Để đáp ứng nhu cầu khác nhau, Scale AI phát triển các sản phẩm/dịch vụ con trong Data Engine: Scale Rapid, Scale Studio và Scale Pro↗. Scale Rapid là dịch vụ tự phục vụ, cho phép đội ngũ ML của khách hàng nhanh chóng tải dữ liệu, thiết lập hướng dẫn gán nhãn và gửi cho workforce của Scale xử lý – nhận kết quả chỉ sau vài giờ, phù hợp cho dự án cần tốc độ và không yêu cầu cam kết tối thiểu↗. Scale Studio là nền tảng dành cho khách hàng muốn tự quản lý đội ngũ gán nhãn nội bộ của mình nhưng tận dụng công cụ của Scale để tăng hiệu suất↗. Khách hàng có thể dùng giao diện Studio để phân công công việc cho team nội bộ, theo dõi năng suất, độ chính xác, và tận dụng các tính năng hỗ trợ (như ML-assisted labeling) mà Scale cung cấp↗. Cuối cùng, Scale Pro là dịch vụ cao cấp “full-service” – Scale AI trực tiếp đảm nhiệm toàn bộ dự án gán nhãn phức tạp với khối lượng lớn, có tích hợp API, quản lý dự án riêng và cam kết SLA chất lượng↗. Scale Pro hướng tới các doanh nghiệp yêu cầu dữ liệu đặc thù, độ chính xác tuyệt đối và sẵn sàng trả phí cao để được phục vụ tận tay↗. Tất cả các gói dịch vụ trên đều hoạt động dựa trên cùng hạ tầng Data Engine và có thể tùy biến theo nhu cầu khách hàng↗.
Mở rộng sản phẩm & nền tảng AI: Bắt đầu từ 2020, Scale AI không chỉ dừng ở gán nhãn dữ liệu thô, mà còn mở rộng sang các công cụ quản lý dữ liệu và phát triển mô hình. Tháng 8/2020, công ty ra mắt Scale Nucleus – một nền tảng SaaS quản lý tập dữ liệu và “gỡ lỗi” dữ liệu cho đội ngũ ML↗. Nucleus cho phép kỹ sư dữ liệu hiểu, trực quan hóa và lọc dữ liệu dễ dàng: ví dụ khám phá tập dữ liệu, tìm và sửa nhãn lỗi, so sánh các phiên bản mô hình qua các metric chính, và tìm ra trường hợp mô hình thất bại↗. Nucleus tích hợp chặt chẽ với Data Engine: người dùng có thể tải các dự đoán của mô hình lên Nucleus để so sánh với ground-truth, tìm những “slice” dữ liệu thú vị, rồi gửi lại các đoạn dữ liệu đó để gán nhãn bổ sung – tạo thành vòng lặp cải thiện dữ liệu liên tục↗↗. Sản phẩm này giúp các team ML “debug” mô hình bằng cách cải thiện chất lượng tập dữ liệu huấn luyện một cách có hệ thống, thay vì làm thủ công thiếu công cụ.
Đón đầu xu hướng AI tạo sinh (generative AI), tháng 11/2022 Scale AI công bố sản phẩm Scale Spellbook – một nền tảng hỗ trợ các developer xây dựng, so sánh và triển khai ứng dụng dùng mô hình ngôn ngữ lớn↗. Spellbook (thuộc Scale Generative AI Platform) cung cấp giao diện để lập trình các prompt, lựa chọn mô hình (cả thương mại và open-source), tinh chỉnh hyperparameter, và triển khai thành API phục vụ ứng dụng thực tế↗↗. Điểm mạnh của Spellbook là tích hợp sẵn công cụ A/B testing và giám sát hiệu năng mô hình theo thời gian thực (độ trễ, độ ổn định, chi phí token)↗, cũng như khả năng tạo các bộ kiểm thử (regression tests) và so sánh nhiều phiên bản mô hình để đánh giá chất lượng trước khi đưa vào sản xuất↗↗. Ngoài ra, Spellbook hỗ trợ fine-tuning (tái huấn luyện tinh chỉnh) mô hình LLM trên dữ liệu riêng của khách hàng – tính đến 10/2025, nền tảng này cho phép fine-tune trên các model của OpenAI và FLAN-T5↗. Spellbook hướng đến việc đơn giản hóa quá trình đưa ứng dụng AI tạo sinh vào thực tiễn, nhấn mạnh khả năng tích hợp “human feedback” trong vòng lặp phát triển: ví dụ, lập trình viên có thể yêu cầu đội ngũ đánh giá con người (của Scale hoặc nội bộ) chấm chất lượng đầu ra của các phiên bản mô hình ngay trong Spellbook↗↗. Điều này thực chất là cung cấp dịch vụ RLHF (Reinforcement Learning from Human Feedback) quy mô lớn – một năng lực mà Scale AI đã nhanh chóng nắm bắt nhờ mạng lưới nhân sự trình độ cao của mình.
Song song, Scale AI cũng phát triển các giải pháp chuyên biệt cho mảng quốc phòng và chính phủ. Sản phẩm tiêu biểu là Scale Donovan – một bộ giải pháp AI trọn gói dành riêng cho cơ quan liên bang Mỹ↗. Donovan có khả năng tiếp nhận dữ liệu đa nguồn (đám mây, tại chỗ, dữ liệu mật…), tự động tổ chức và cho phép các nhà phân tích tương tác với dữ liệu tình báo thông qua giao diện hỏi đáp ngôn ngữ tự nhiên↗. Ví dụ, một sĩ quan có thể dùng Donovan để hỏi về các sự kiện diễn ra trong một khu vực trên bản đồ, hệ thống sẽ tìm trong các dòng dữ liệu cảm biến, văn bản tình báo liên quan và trả lời bằng ngôn ngữ tự nhiên, kèm hình ảnh trực quan (như ghim vị trí trên bản đồ)↗↗. Donovan tích hợp công nghệ Retrieval-Augmented Generation (RAG) và giao diện chat LLM tùy biến cho phép trích xuất thông tin từ tài liệu, dịch thuật, truy vấn cơ sở dữ liệu bằng ngôn ngữ tự nhiên (text-to-API)↗↗. Ngoài ra, người dùng có thể yêu cầu Donovan tự động tổng hợp báo cáo từ các dữ liệu mới cập nhật, giúp rút ngắn thời gian phân tích từ hàng giờ xuống vài phút↗↗. Nói cách khác, Donovan là sự kết hợp giữa nền tảng dữ liệu của Scale với sức mạnh LLM, nhằm hỗ trợ ra quyết định quân sự một cách nhanh và thông minh hơn. Việc đầu tư xây dựng sản phẩm riêng cho chính phủ cho thấy chiến lược B2G nghiêm túc của Scale AI nhằm phục vụ các bài toán an ninh, quốc phòng đòi hỏi xử lý dữ liệu lớn.
Cuối cùng, một mảng rất quan trọng trong hệ sinh thái Scale AI là nền tảng đánh giá và an toàn mô hình. Công ty nhận ra rằng không chỉ dữ liệu huấn luyện, mà dữ liệu đánh giá (evaluation) cũng cực kỳ cần thiết để phát triển AI có trách nhiệm. Họ đã xây dựng phòng thí nghiệm nghiên cứu SEAL (Safety, Evaluations, and Alignment Lab) và nền tảng Scale Evaluation với nhiều công cụ đánh giá độ hiệu quả và tính an toàn của mô hình AI↗↗. Scale Evaluation cung cấp bộ chỉ số chi tiết để phân tích điểm mạnh, điểm yếu của các mô hình, đặc biệt tập trung vào các rủi ro của LLM như: phát tán thông tin sai lệch, thiên kiến độc hại, rò rỉ thông tin cá nhân, hay việc mô hình bị lợi dụng để hướng dẫn tấn công mạng hoặc chế tạo vũ khí nguy hiểm↗↗. Nền tảng này cho phép đánh giá mô hình bằng cả phương pháp tự động (các chỉ số định lượng như độ chính xác, F1, độ đo Mauve cho đánh giá phân phối văn bản dài, v.v.) và phương pháp thủ công với con người (cho các nhiệm vụ cần nhận định định tính)↗↗. Nhờ uy tín trong lĩnh vực này, Scale AI đã được Nhà Trắng lựa chọn làm đơn vị tổ chức đánh giá độc lập các mô hình AI mạnh hàng đầu (của nhiều hãng khác nhau) công bố ra công chúng↗. Tháng 5/2024, Scale AI ra mắt SEAL Leaderboards – bảng xếp hạng hiệu năng của các mô hình AI tiên tiến trên nhiều tiêu chí (tư duy toán học, hiểu mã lệnh, ngoại ngữ, tuân thủ chỉ dẫn…) dựa trên bộ dữ liệu đánh giá riêng do họ xây dựng↗↗. Đặc biệt, các bộ dữ liệu đánh giá này được giữ kín và chỉ cho mô hình truy cập giới hạn để tránh hiện tượng “học tủ” nhằm đạt điểm cao không trung thực↗. Qua đó, Scale AI muốn thiết lập tiêu chuẩn vàng mới về đánh giá và xếp hạng mô hình, thúc đẩy phát triển AI có trách nhiệm và chính xác hơn.
Tóm lại, danh mục sản phẩm của Scale AI ngày càng mở rộng, từ “data engine” gán nhãn dữ liệu (lõi) cho đến công cụ quản lý dữ liệu (Nucleus), nền tảng xây dựng ứng dụng AI tạo sinh (Spellbook/GenAI), giải pháp AI cho quốc phòng (Donovan) và nền tảng đánh giá độ an toàn mô hình (SEAL). Tất cả tạo thành một hệ sinh thái xoay quanh dữ liệu và chất lượng mô hình AI – đúng với tầm nhìn trở thành “hạ tầng nền tảng của AI” mà công ty theo đuổi. Nhờ chiến lược này, Scale AI không chỉ cung cấp dịch vụ gán nhãn thuê ngoài, mà còn tiến vào các khâu giá trị cao hơn trong chuỗi phát triển AI, củng cố vị thế của mình trong thị trường.
3. Thị trường, khách hàng & cạnh tranh
Thị trường data labeling & nhu cầu khách hàng: Sự bùng nổ của AI những năm 2016–2023 kéo theo nhu cầu khổng lồ về dữ liệu huấn luyện chất lượng cao cho các mô hình học máy. Thị trường dịch vụ gán nhãn dữ liệu (data labeling) đã phát triển nhanh để đáp ứng nhu cầu này, phục vụ nhiều lĩnh vực: ô tô tự lái, thị giác máy tính trong bán lẻ, nhận dạng ngôn ngữ, phân tích tài liệu, v.v. Tuy nhiên, bản thân dịch vụ gán nhãn có phần dễ bị thương mại hóa đại trà (commoditized) – có nhiều nhà cung cấp sử dụng mô hình lao động tương tự, khiến việc tạo lợi thế cạnh tranh bền vững là thách thức↗. Ngay từ khi khởi đầu, Scale AI đã phải đối mặt với các đối thủ như Amazon Mechanical Turk, Labelbox, Appen, Hive, v.v. – những công ty cũng dùng nguồn nhân lực đám đông để gắn nhãn dữ liệu cho các khách hàng không tự làm được↗. Chẳng hạn, Appen (Úc, thành lập 2011) hoạt động tương tự như một “Upwork cho người gán nhãn” và từng rất thành công (IPO năm 2017) nhưng đến cuối 2025 giá trị thị trường chỉ còn ~140 triệu USD↗. Điều này cho thấy các dịch vụ thuần nhân lực có biên lợi nhuận thấp và dễ bị thay thế nếu không đầu tư công nghệ. Một đối thủ khác là Labelbox (Mỹ, thành lập 2018) – cung cấp nền tảng quản lý dữ liệu và gán nhãn, đã huy động ~189 triệu USD vốn↗. Labelbox tập trung vào cung cấp phần mềm để khách hàng tự xây dựng pipeline ML (có nét tương đồng Scale Studio) và cũng mở rộng sang tính năng đánh giá mô hình, cạnh tranh trực tiếp với một số mảng của Scale. Hive (Mỹ, thành lập 2013) thì xây dựng sẵn các model AI thương mại (ví dụ model nhận diện/nhãn nội dung cho mạng xã hội, app hẹn hò…) và cung cấp qua API↗. Hive đã huy động ~121 triệu USD, định giá 2 tỷ năm 2021↗ – họ nhấn mạnh vào giải pháp nhanh gọn cho khách hàng B2C (ví dụ duyệt nội dung thời gian thực), trong khi Scale AI chủ yếu phục vụ các bài toán AI phức tạp cho doanh nghiệp & chính phủ nên định vị sản phẩm có khác biệt↗. Bên cạnh đó, các công ty lớn như Google, Amazon, Microsoft cũng phát triển hệ sinh thái ML toàn diện trên cloud của mình, tích hợp cả dịch vụ gán nhãn (VD: Amazon có Mechanical Turk và SageMaker Ground Truth, Google có Data Labelling Service trên GCP)↗. Những gã khổng lồ này cung cấp giải pháp end-to-end từ lưu trữ dữ liệu (S3, BigQuery) đến công cụ huấn luyện (SageMaker, Vertex AI), do đó cạnh tranh gián tiếp với tham vọng mở rộng của Scale AI. Tuy nhiên, các dịch vụ cloud thường đòi hỏi khách hàng tự thao tác nhiều hơn, trong khi Scale AI lại có lợi thế dịch vụ “cầm tay chỉ việc” và chuyên sâu vào dữ liệu đặc thù.
Tệp khách hàng và hợp đồng tiêu biểu: Scale AI khởi đầu bằng cách nhắm vào các hãng xe tự hành – thị trường khi đó (2016–2018) rất “khát” dữ liệu gán nhãn (hình ảnh camera, dữ liệu LIDAR) để huấn luyện xe nhận diện môi trường. Những khách hàng sớm của Scale có Waymo (Google), Cruise (GM), Uber ATG, Lyft… cũng như các công ty ô tô truyền thống đang đầu tư xe tự lái như Toyota, Honda↗. Ví dụ, với một hãng xe tự lái, Scale sẽ nhận các khung hình video do xe thu thập và vẽ nhãn phân đoạn (segmentation) để đánh dấu từng chiếc xe, người đi bộ, biển báo trong cảnh – tạo dữ liệu cho xe học cách “nhìn” đường phố↗. Nhờ đảm bảo chất lượng nhãn cao (độ chính xác tới ~99% theo một số nguồn↗), Scale nhanh chóng mở rộng sang lĩnh vực khác. Các công ty Internet lớn như Airbnb, Pinterest, Etsy, PayPal, Square cũng trở thành khách hàng, thuê Scale AI gán nhãn dữ liệu để cải thiện sản phẩm của họ (ví dụ Pinterest dùng để phân loại nội dung hình ảnh tốt hơn, PayPal dùng để nhận diện gian lận, v.v.)↗. Đặc biệt, OpenAI – đơn vị phát triển ChatGPT – đã hợp tác với Scale AI trong việc tinh chỉnh mô hình ngôn ngữ và kiểm tra độ an toàn, giúp Scale mở rộng dịch vụ sang mảng LLM fine-tuning từ khoảng 2021↗. Bản thân Alexandr Wang từng sống chung nhà với CEO OpenAI Sam Altman trong giai đoạn COVID và có mối quan hệ thân thiết↗↗, phần nào tạo thuận lợi cho quan hệ hợp tác. Ngoài OpenAI, các startup AI hàng đầu khác như Anthropic, Cohere, xAI cũng sử dụng dịch vụ của Scale để thu thập dữ liệu huấn luyện đặc thù (ví dụ Anthropic thuê Scale gán nhãn các tình huống đối thoại để huấn luyện Claude). Trong lĩnh vực tài chính, khách hàng như Brex (fintech) dùng Scale để trích xuất thông tin từ chứng từ giấy tờ↗, hay các tập đoàn tư vấn như Accenture hợp tác với Scale trong dự án triển khai AI cho doanh nghiệp lớn↗.
Một hướng khách hàng quan trọng khác là chính phủ và quốc phòng (B2G). Scale AI bắt đầu làm dự án cho Bộ Quốc phòng Mỹ (DoD) từ sớm – theo Reuters, ngay năm 2020 công ty đã có hợp đồng với Lầu Năm Góc và Không quân Hoa Kỳ↗. Họ tham gia các dự án phân tích ảnh vệ tinh, xử lý tài liệu tình báo… cho chính phủ Mỹ↗. Điển hình, trong cuộc xung đột tại Ukraine, Scale AI hỗ trợ Bộ Quốc phòng phân tích hình ảnh vệ tinh để theo dõi tình hình chiến sự↗. Đến năm 2022–2023, Scale thành lập AI Hub tại St. Louis (trung tâm tình báo địa không gian của Mỹ) để trực tiếp hỗ trợ các nhiệm vụ quốc phòng↗. Năm 2025, công ty đạt những thỏa thuận lớn về phía chính phủ: tháng 8/2025, Lục quân Mỹ (Army) ký hợp đồng trị giá 99 triệu USD với Scale AI nhằm đẩy nhanh nghiên cứu phát triển AI cho quân đội↗. Tiếp đó, tháng 9/2025, Văn phòng Trí tuệ Nhân tạo & Kỹ thuật số (CDAO) của Bộ Quốc phòng chọn Scale AI làm đối tác cung cấp nền tảng AI cho các đơn vị tác chiến, theo một thỏa thuận 5 năm trị giá 100 triệu USD↗. Những hợp đồng này khẳng định vị thế của Scale AI như một đối tác chủ chốt của chính phủ Mỹ trong việc đưa AI vào ứng dụng quốc phòng, cạnh tranh trực tiếp với các nhà thầu truyền thống và những công ty như Palantir.
Biến động gần đây & cạnh tranh giành khách hàng: Bước ngoặt lớn đến vào giữa năm 2025 khi Meta công bố đầu tư 49% cổ phần vào Scale AI. Động thái này gây lo ngại cho nhiều khách hàng lớn của Scale về tính trung lập dữ liệu: họ sợ rằng việc tiếp tục thuê Scale có thể vô tình “tiết lộ” thông tin chiến lược và dữ liệu nhạy cảm cho Meta (một đối thủ cạnh tranh trong đường đua AI)↗. Kết quả là một số khách hàng đã phản ứng mạnh: Google, khách hàng lớn nhất của Scale AI (dự chi ~200 triệu USD cho Scale trong năm 2025), tuyên bố kế hoạch chấm dứt hợp tác và chuyển toàn bộ hợp đồng gán nhãn sang nhà cung cấp khác ngay sau khi nghe tin Meta trở thành cổ đông↗↗. Được biết năm 2024 Google đã chi khoảng 150 triệu USD cho dịch vụ của Scale↗, chủ yếu để gán nhãn dữ liệu huấn luyện mô hình AI Gemini (đối thủ của ChatGPT). Việc Google rời đi là tổn thất rất lớn cho Scale, do doanh thu của công ty tập trung vào một số ít khách hàng lớn (Google chiếm phần đáng kể)↗. Cùng lúc, Microsoft, OpenAI và startup xAI của Elon Musk cũng lần lượt giảm hoặc tạm dừng sử dụng dịch vụ của Scale AI↗. (OpenAI thực tế đã bắt đầu rút dần vài tháng trước đó, chuyển sang kết hợp nhiều nhà cung cấp khác nhau)↗. Nguyên nhân chung là lo ngại dữ liệu nội bộ có thể lọt vào tay Meta – công ty mẹ của một đối thủ cạnh tranh.
Sự cố này đã tạo cơ hội lớn cho các đối thủ cạnh tranh nhảy vào giành khách hàng từ Scale. Theo Reuters, ngay trong tuần Meta-Scale công bố thỏa thuận, Google đã liên hệ với nhiều nhà cung cấp dịch vụ gán nhãn khác để thay thế Scale↗. Các startup đối thủ như Surge AI, Labelbox, Appen, Sama… ghi nhận nhu cầu đặt hàng tăng đột biến. CEO Labelbox tự tin tuyên bố công ty mình có thể thu về “hàng trăm triệu USD doanh thu mới” từ làn sóng khách hàng rời bỏ Scale AI↗. Một công ty khác (Handshake) báo cáo lượng yêu cầu từ khách hàng tăng gấp 3 lần so với trước↗. Như vậy, cục diện cạnh tranh trong mảng dịch vụ dữ liệu AI đang thay đổi nhanh chóng: Scale AI từ vị trí dẫn đầu với lợi thế về quy mô và uy tín, nay phải đối mặt nguy cơ mất thị phần do vấn đề niềm tin khách hàng. Trong khi đó, các đối thủ nhỏ linh hoạt hơn sẵn sàng lấp chỗ trống và thậm chí các ông lớn (Google, OpenAI) cũng đầu tư xây dựng đội ngũ gán nhãn nội bộ để giảm phụ thuộc đối tác↗. Dù vậy, Scale AI vẫn có những điểm mạnh riêng (xem phần Moat bên dưới) và đa dạng khách hàng ở lĩnh vực khác (như chính phủ, xe tự lái) chưa bị ảnh hưởng bởi sự cố Meta. Tương lai thị trường sẽ phụ thuộc vào việc Scale AI có lấy lại được lòng tin và tiếp tục dẫn đầu về công nghệ/hiệu quả so với các lựa chọn thay thế hay không.
4. Tài chính, funding & định giá
Scale AI đã trải qua nhiều vòng gọi vốn với tốc độ định giá tăng phi mã, phản ánh niềm tin của nhà đầu tư vào tiềm năng thị trường AI hạ tầng. Dưới đây là tóm tắt các mốc huy động vốn quan trọng của công ty:
-
Seed (2016): Tham gia Y Combinator, nhận 120.000 USD tiền hạt giống (đổi ~7% cổ phần).
-
Series A (04/2017): Gọi 4,5 triệu USD do Accel dẫn đầu (định giá không công bố)↗.
-
Series B (08/2018): Gọi 18 triệu USD do Index Ventures dẫn đầu (định giá không công bố)↗.
-
Series C (08/2019): Gọi 100 triệu USD do Founders Fund dẫn dắt, nâng định giá vượt mốc 1 tỷ USD (Scale AI chính thức thành “kỳ lân”)↗. Nhà sáng lập Wang lúc này mới 22 tuổi.
-
Series D (12/2020): Gọi 155 triệu USD do Tiger Global dẫn đầu, định giá khoảng 3,5 tỷ USD↗ (gấp ~3,5 lần chỉ sau ~1 năm).
-
Series E (04/2021): Gọi 325 triệu USD đồng dẫn dắt bởi Dragoneer, Greenoaks và Tiger Global, định giá tăng vọt lên ~7,3 tỷ USD↗ (định giá tăng gấp đôi chỉ trong 4 tháng nhờ nhu cầu thị trường AI nóng). Đáng chú ý, trong vòng này có sự tham gia của các quỹ lớn (Wellington, Durable Capital) và cả khách hàng chiến lược (như nhà cựu CEO Amazon Jeff Wilke tham gia cố vấn)↗↗.
-
Series F (05/2024): Gọi 1 tỷ USD (pha trộn vốn mới + mua cổ phần thứ cấp) do Accel dẫn đầu, định giá 13,8 tỷ USD↗. Vòng này có sự góp mặt của nhiều nhà đầu tư tên tuổi: các quỹ VC (Accel, Coatue, Index, Founders Fund, Tiger, Thrive, Spark, Greenoaks, DFJ Growth…), các nhà đầu tư chiến lược trong ngành chip và cloud (NVIDIA, Intel Capital, AMD, Qualcomm, Cisco, ServiceNow Ventures) và cả Big Tech (Amazon, Meta đều tham gia)↗. Việc những tập đoàn lớn như Amazon, Meta rót tiền cho thấy họ muốn có “cửa sổ” vào mảng dữ liệu AI và đảm bảo nguồn lực cho chính mình. Sau Series F, tổng vốn huy động của Scale AI (từ 2016) khoảng 1,6 tỷ USD↗.
-
Series G (?) – Thỏa thuận Meta (06/2025): Meta Platforms chi 14,3 tỷ USD để mua lại 49% cổ phần của Scale AI (không thông qua quyền biểu quyết)↗. Thỏa thuận định giá công ty ở mức 29 tỷ USD – hơn gấp đôi so với định giá Series F một năm trước đó↗. Đây là khoản đầu tư lớn thứ hai lịch sử của Meta (chỉ sau thương vụ mua WhatsApp)↗, và là thương vụ đầu tư tư nhân “khủng” hiếm có trong ngành startup AI. Sau thương vụ này, Alexandr Wang rời vị trí CEO để đầu quân cho Meta, giữ vai trò lãnh đạo phòng thí nghiệm AI tiên tiến của Meta↗↗. Scale AI vẫn vận hành độc lập dưới quyền đội ngũ quản lý mới, còn Meta trở thành cổ đông chiến lược dài hạn. (Lưu ý: thương vụ Meta không hẳn là Series G vì không phải đầu tư VC thuần túy, mà mang tính chất gần như sáp nhập một phần).
Ngoài các vòng trên, Scale AI cũng từng thảo luận về việc mở tender offer trên thị trường thứ cấp đầu 2025 ở mức định giá 20–25 tỷ USD↗, nhưng sau đó thương vụ Meta đã bao gồm việc mua lại cổ phần từ nhân viên/cổ đông hiện hữu ở mức định giá cao hơn, giúp nhiều người (trong đó có Lucy Guo – đồng sáng lập đã rời công ty) trở thành tỷ phú USD↗↗. Tổng cộng, tính cả tiền từ Meta, công ty đã huy động khoảng 15,9 tỷ USD vốn↗ – một con số kỷ lục đối với startup tư nhân.
Về tình hình tài chính, Scale AI đang ở giai đoạn tăng trưởng nhanh, chưa có lãi nhưng doanh thu tăng đều qua các năm. Doanh thu năm 2021 ước tính cỡ vài trăm triệu USD; năm 2022 đạt ~$250M; năm 2023 vọt lên ~$760M; năm 2024 khoảng 870 triệu USD↗. Dù 2024 không đạt mục tiêu nội bộ 1 tỷ USD, tốc độ tăng trưởng vẫn 14–15% so với 2023. Đặc biệt, công ty đặt kế hoạch năm 2025 doanh thu 2 tỷ USD↗ (tương ứng tăng 130% trong một năm, nhờ các hợp đồng lớn trong lĩnh vực AI tạo sinh và quốc phòng). Tuy nhiên, việc mất một số khách hàng lớn cuối 2025 có thể ảnh hưởng mục tiêu này. Về lợi nhuận, Scale AI chưa công bố số liệu chính thức (vì là công ty tư nhân), nhưng có tin từ The Information rằng công ty trượt mục tiêu lợi nhuận 2024 và đã phải điều chỉnh chi phí↗. Thực tế, đầu năm 2023, Scale AI đã sa thải ~20% nhân sự do “tuyển dụng quá mức năm 2021–2022” khi tăng trưởng nóng chững lại↗. Tới tháng 7/2025, ngay sau khi CEO Wang rời đi, công ty tiếp tục cắt giảm 14% nhân viên (khoảng 200 người, chủ yếu ở bộ phận AI tạo sinh) do mất một số hợp đồng lớn và tái cơ cấu tổ chức↗↗. Những động thái này cho thấy dù doanh thu cao, Scale AI cũng chịu sức ép tối ưu chi phí và đạt lợi nhuận (nhất là khi thị trường vốn siết chặt sau năm 2022).
Về định giá và suất đầu tư, các nhà đầu tư ban đầu của Scale AI đã có tỷ suất sinh lời cực lớn. Từ Seed đến Series F, định giá tăng ~115 lần (13.8B/120M). Với việc Meta định giá 29B, mức tăng là ~240 lần so với seed ban đầu, trong 9 năm. Những quỹ như Accel, Founders Fund, Y Combinator, Index Ventures – tham gia từ sớm – đều được hưởng lợi lớn. Tuy nhiên, cần lưu ý định giá 29B đến từ một nhà đầu tư chiến lược (Meta), không hẳn phản ánh giá thị trường chung. Nếu không có Meta, định giá hợp lý của Scale AI có thể quanh 15–20B (theo Bloomberg, công ty từng nhắm mức ~25B trong đợt chào bán cổ phần 2025)↗. Dù vậy, Scale AI hiện nằm trong top những startup AI giá trị nhất thế giới, sánh ngang các công ty AI thuần khác như OpenAI, Anthropic (định giá 20–30B)↗. Việc Meta rót số tiền kỷ lục cũng cho thấy một xu hướng: các Big Tech sẵn sàng chi đậm để thâu tóm công nghệ và nhân tài AI hứa hẹn, thay vì để các công ty này IPO độc lập. (Thương vụ này xảy ra trong bối cảnh thị trường IPO công nghệ ảm đạm 2022–2023, vì vậy việc Scale chọn bắt tay với Meta thay vì IPO có lẽ là quyết định được cổ đông ủng hộ để hiện thực hóa lợi nhuận sớm.)
Tổng quan tài chính: Scale AI có doanh thu tăng mạnh nhưng cũng tăng chi phí cao để mở rộng (thu lỗ kế hoạch), được chống lưng bởi dòng vốn đầu tư dồi dào. Định giá công ty đã có lúc gấp ~33 lần doanh thu (29B so với ~870M doanh thu 2024), phản ánh kỳ vọng rất lớn của thị trường vào tăng trưởng tương lai. Với việc mất một số khách hàng gần đây, thách thức đặt ra là duy trì đà tăng doanh thu và chứng minh được lợi nhuận trong dài hạn, để bảo vệ mức định giá “khủng” đã đạt được.
5. Moat, chiến lược & rủi ro
Lợi thế cạnh tranh (Moat): Mặc dù lĩnh vực gán nhãn dữ liệu nhìn bề ngoài là lao động thủ công dễ bị sao chép, Scale AI đã xây dựng được một số moat đáng kể qua thời gian:
-
Data Flywheel & thuật toán vượt trội: Lợi thế dài hạn lớn nhất của Scale AI nằm ở lượng dữ liệu khổng lồ họ đã xử lý và mô hình ML nội bộ được “đào tạo” từ chính quy trình gán nhãn. Như nhà phân tích Packy McCormick nhận xét, đội ngũ người gán nhãn của Scale vừa tạo ra giá trị trực tiếp, vừa âm thầm huấn luyện cho hệ thống AI của công ty ngày càng thông minh hơn↗. Theo thời gian, tỷ lệ công việc do máy tự động của Scale đảm nhiệm tăng lên, giảm dần phụ thuộc vào con người mà vẫn đảm bảo chất lượng↗. Scale AI có lợi thế độc nhất ở chỗ họ đã thu thập được kho dữ liệu nhãn chuẩn chất lượng cao đa lĩnh vực lớn bậc nhất thế giới – dùng để train các mô hình gán nhãn tự động riêng. Một đối thủ chủ yếu dựa vào thuê ngoài nhân công như Appen khó lòng cạnh tranh về mặt này↗. Nói cách khác, Scale sở hữu một “vòng lặp dữ liệu – mô hình – dữ liệu” tự tăng cường: càng làm nhiều dự án, mô hình gán nhãn càng tốt; mô hình càng tốt thì phục vụ được dự án khó hơn, thu hút thêm khách hàng, lại sinh thêm dữ liệu để cải thiện tiếp. Đây là moat công nghệ và dữ liệu rất khó nhân bản đối với người đi sau.
-
Đa dạng hóa & tích hợp dịch vụ: Không dừng ở gán nhãn thô, Scale AI mở rộng sang nhiều mảng liền kề (đánh giá mô hình, quản trị dữ liệu, công cụ LLM, ứng dụng cho chính phủ…). Điều này giúp công ty trở thành “one-stop shop” về dữ liệu AI cho khách hàng doanh nghiệp lớn. Ví dụ, một hãng xe tự lái có thể dùng dịch vụ của Scale từ khâu thu thập dữ liệu sensor, gán nhãn hình ảnh, quản lý tập dữ liệu (Nucleus) đến đánh giá độ chính xác mô hình (Evaluation). Tính tích hợp này tạo ra chi phí chuyển đổi cao – một khi đã dùng hệ sinh thái Scale, khách hàng khó tách rời từng phần ra để thay bằng nhà cung cấp khác. Hơn nữa, việc phục vụ khách hàng ở nhiều khâu giúp Scale AI nắm insight sâu về bài toán của khách, từ đó tối ưu giải pháp và tư vấn chiến lược dữ liệu tốt hơn đối thủ chỉ làm một khâu. Đây là lợi thế về phạm vi dịch vụ.
-
Chuyên sâu thị trường enterprise & B2G: Khác với một số startup chỉ nhắm thị trường nhỏ lẻ, Scale AI tập trung phục vụ những khách hàng doanh nghiệp/tổ chức lớn nhất – nơi chất lượng và bảo mật quan trọng hơn giá rẻ. Ví dụ, họ ký các hợp đồng nhiều năm với các hãng xe, tập đoàn tài chính, cơ quan quân đội…, những khách hàng này thường trung thành nếu dịch vụ tốt và khó tự xây dựng nội bộ do hạn chế về chuyên môn. Việc bám sát nhu cầu các “ông lớn” giúp Scale AI xây dựng uy tín như một đối tác đáng tin cậy. Trong phân khúc này, cạnh tranh chủ yếu dựa vào chất lượng, độ tin cậy và bảo mật hơn là giá, mà đó chính là thế mạnh của Scale. Ngoài ra, công ty đã đầu tư đáp ứng các tiêu chuẩn cao (như vận hành trên môi trường Top Secret của chính phủ Mỹ↗, tuân thủ bảo mật dữ liệu…) tạo nên rào cản gia nhập cho đối thủ nào muốn nhảy vào phục vụ các khách hàng “khó tính” tương tự.
-
Mối quan hệ đối tác & cộng đồng chuyên gia: Scale AI xây dựng được mạng lưới quan hệ rộng trong hệ sinh thái AI. Họ hợp tác chặt chẽ với các trung tâm nghiên cứu (như Toyota Research Institute cung cấp dữ liệu xe tự lái để Scale rèn luyện thuật toán tốt hơn↗) và các phòng thí nghiệm AI hàng đầu (OpenAI, Google Brain trước đây). Công ty cũng thành lập SEAL như một cộng đồng quy tụ hàng ngàn chuyên gia “red team” (bao gồm tiến sĩ, kỹ sư, nhà ngôn ngữ…) để kiểm thử độ an toàn cho AI↗↗. Đội ngũ này chính là nguồn nhân lực trình độ cao để thực hiện các dự án RLHF phức tạp, mà không phải công ty nào cũng có sẵn. Có thể nói, Scale AI không chỉ có “đội quân 240k” ở cấp độ tác vụ đơn giản, mà còn sở hữu “đội đặc nhiệm” gồm các chuyên gia AI, giúp công ty đảm nhận được những dự án tinh vi (ví dụ đánh giá mô hình frontier như GPT-4, Claude…). Đây là moat về nhân lực và tri thức cộng đồng, rất phù hợp với xu hướng phát triển AI an toàn.
-
Uy tín thương hiệu & quy mô dẫn đầu: Là người tiên phong và đạt thành công sớm, Scale AI đã xây dựng được thương hiệu mạnh trong ngành AI. Họ thường xuyên được nhắc đến như đối tác của những cái tên đình đám (các khách hàng nổi bật đã liệt kê ở phần trên). Chính phủ Mỹ cũng công khai ca ngợi vai trò của các công ty như Scale trong việc bảo đảm Mỹ duy trì lợi thế AI↗. Thương hiệu uy tín giúp công ty thu hút khách hàng mới dễ dàng hơn (vì “khách hàng của tôi gồm Google, DoD…” là bảo chứng tốt), đồng thời thu hút vốn đầu tư nhân tài hàng đầu (ví dụ cựu lãnh đạo Amazon toàn cầu tham gia hội đồng cố vấn↗). Bên cạnh đó, quy mô nhân sự lớn và nguồn vốn dồi dào cho phép Scale AI chào giá cạnh tranh hoặc đầu tư hạ tầng tốt hơn các startup nhỏ. Đây là lợi thế kinh tế theo quy mô (economy of scale) – ví dụ Scale có thể nhận những hợp đồng “khủng” cả trăm triệu USD mà ít công ty đủ nguồn lực để thực hiện đúng hạn.
Tóm lại, moat của Scale AI nằm ở sự kết hợp giữa công nghệ (thuật toán gán nhãn tự động), dữ liệu (khối lượng và đa dạng vượt trội), dịch vụ tích hợp sâu rộng, độ tin cậy đã được khẳng định và mối quan hệ vững chắc với khách hàng lớn. Những yếu tố này đan xen tạo ra lợi thế cạnh tranh không dễ bị xói mòn một sớm một chiều. Dẫu vậy, như sự cố Meta cho thấy, moat nào cũng có thể lung lay nếu công ty đánh mất niềm tin từ thị trường – đây là điều Scale AI phải đặc biệt chú ý.
Chiến lược phát triển: Về chiến lược, Scale AI đã có những bước đi táo bạo và linh hoạt sau: (1) Chọn thị trường ngách phù hợp và mở rộng dần – ban đầu tập trung xe tự lái (đúng thời điểm bùng nổ, ít đối thủ), sau đó mở rộng sang nhiều ngành AI khác (thương mại điện tử, tài chính, generative AI). (2) Tập trung phân khúc cao cấp (upmarket) – phục vụ enterprise, chính phủ với hợp đồng lớn dài hạn, thay vì thị trường gán nhãn nhỏ lẻ giá rẻ. Điều này giúp công ty tăng trưởng doanh thu nhanh và tạo thương hiệu tốt. (3) Liên tục mở rộng sản phẩm/dịch vụ – Scale không ngại thử nghiệm cái mới, từ Synthetic data, Document AI, e-commerce AI cho đến chatbot (một số dự án phụ có thử và ngừng↗). Triết lý “move fast and iterate” này giúp họ sớm nắm bắt xu hướng (như ra mắt Spellbook ngay khi LLM rộ lên). (4) Tận dụng vốn đầu tư để “đi trước một bước” – Công ty chấp nhận huy động rất nhiều vốn và chấp nhận lỗ để xây dựng năng lực toàn diện trước khi có lợi nhuận. Ví dụ, họ tuyển mộ đội ngũ nghiên cứu AI an toàn (SEAL) và phát triển sản phẩm miễn phí (leaderboard) nhằm tạo tầm ảnh hưởng, dù trực tiếp chưa mang lại doanh thu. Đây là chiến lược dài hơi để chiếm lĩnh vị trí hạ tầng – tương tự cách Amazon đã lỗ nhiều năm cho AWS trước khi “ăn quả ngọt”. (5) Đặt cược quan hệ chiến lược – Thương vụ Meta có thể xem như bước đi chiến lược nhằm liên minh với một Big Tech để phát triển AI mạnh hơn (Meta có tài nguyên compute, dữ liệu mạng xã hội khổng lồ; Scale có đội ngũ và công nghệ dữ liệu). Về lý thuyết, sự kết hợp này có thể tạo ra đột phá trong nghiên cứu AI tổng quát (Meta kỳ vọng Wang sẽ giúp họ vượt Google/OpenAI trong cuộc đua AI↗↗). Nếu thành công, Scale AI (dù mất đi tính độc lập) vẫn ghi dấu ấn là “cánh tay AI” quan trọng của một tập đoàn nghìn tỷ USD.
Rủi ro & thách thức: Bên cạnh cơ hội, Scale AI đối mặt không ít rủi ro:
-
Rủi ro từ sự ra đi của nhà sáng lập: Alexandr Wang được xem là linh hồn của Scale AI, người định hình văn hóa và tầm nhìn công ty. Việc Wang rời ghế CEO giữa 2025 để sang Meta tạo khoảng trống lãnh đạo lớn. Đây là rủi ro điển hình với startup tăng trưởng dựa nhiều vào tài năng của founder. Như một đánh giá đã nêu, “câu chuyện của Scale AI gắn chặt với cá nhân và lý tưởng của Wang; sự vắng mặt của anh ấy đặt ra nhiều dấu hỏi cho tương lai công ty”↗. Ngay sau khi Wang rời đi, Scale AI đã có dấu hiệu xáo trộn (sa thải đội ngũ gen-AI, mất tinh thần nhân viên)↗. Các mối quan hệ với khách hàng, nhà đầu tư cũng có nguy cơ lung lay vì họ mất đi điểm tựa niềm tin từng đặt vào vị founder trẻ tuổi này↗. Nếu ban lãnh đạo mới không đủ tầm, công ty có thể khó duy trì quỹ đạo tăng trưởng như trước. Rủi ro này đòi hỏi Scale AI phải nhanh chóng ổn định tổ chức, chứng minh “Scale không chỉ có Wang”. (Thực tế, Wang vẫn giữ ghế trong HĐQT, nhưng sự tham gia điều hành hàng ngày thì không còn.)
-
Xung đột lợi ích & niềm tin khách hàng (vụ Meta): Như phân tích ở trên, việc Meta trở thành cổ đông lớn đã giáng một đòn vào tính trung lập của Scale AI trong mắt khách hàng. Mô hình kinh doanh B2B của Scale đòi hỏi sự tin cậy tuyệt đối – khách hàng giao data quý báu của họ cho bên thứ ba xử lý. Giờ đây, với việc một đối thủ (Meta) có ảnh hưởng lớn trong công ty, các khách hàng cạnh tranh với Meta (Google, OpenAI, Microsoft….) cảm thấy dữ liệu của họ không an toàn↗. Hệ quả là nhiều hợp đồng bị hủy/giảm, như Google (giá trị ~200M/năm) rút lui↗↗, Microsoft, xAI, OpenAI cũng thu hẹp quy mô hợp tác↗. Tình thế này tạo rủi ro doanh thu sụt giảm mạnh năm 2025–2026 nếu Scale không nhanh chóng tìm khách hàng bù đắp. Hơn nữa, danh tiếng công ty bị ảnh hưởng: từ chỗ là “Thuỵ Sĩ trung lập về dữ liệu”, giờ bị nhìn như “công ty chịu ảnh hưởng của Meta”. Để giảm rủi ro này, Scale AI có thể phải tách bạch các mảng dịch vụ (cam kết với khách rằng Meta không can dự dữ liệu của họ) và tìm kiếm khách hàng mới không xung đột (ví dụ tập trung hơn vào chính phủ, hoặc các ngành mà Meta không cạnh tranh). Dù sao, mất lòng tin là rủi ro nghiêm trọng nhất, đòi hỏi thời gian và hành động quyết liệt để khôi phục.
-
Rủi ro tập trung khách hàng & doanh thu: Liên quan đến trên, trước cú sốc Meta, Scale AI đã phụ thuộc nặng vào một số khách hàng lớn (điển hình Google). Số liệu cho thấy phần lớn doanh thu 2023–2024 đến từ các hãng phát triển mô hình AI (model makers)↗. Nếu một khách hàng rời đi, lỗ hổng rất lớn. Việc Google và có thể Microsoft rút lui đặt ra bài toán đa dạng hóa khách hàng cho Scale. Công ty sẽ phải mở rộng thị trường – có thể sang châu Âu, châu Á (nhưng lại vấp phải quy định dữ liệu, xem rủi ro tiếp theo). Hoặc tăng cường bán cho các doanh nghiệp truyền thống vừa và nhỏ (SMB) – nhưng khác hẳn tệp enterprise họ quen phục vụ. Bài toán “đừng bỏ trứng vào một giỏ” trở nên cấp thiết để giảm thiểu rủi ro doanh thu trong tương lai.
-
Rủi ro cạnh tranh & sức ép giá cả: Như đã nêu, thị trường đang tràn ngập đối thủ, từ startup ngách đến Big Tech. Khi dịch vụ gán nhãn dần bị xem là commodity, khách hàng có xu hướng gây sức ép giảm giá, đặc biệt trong bối cảnh kinh tế khó khăn. Scale AI tuy dẫn đầu nhưng cũng phải theo xu hướng chung: ví dụ nhiều hãng xe tự lái sau khi hết thời kỳ R&D đốt tiền đã cắt giảm chi phí, ép các nhà thầu data giảm giá. Các đối thủ nhỏ hơn sẵn sàng phá giá để giành hợp đồng (vì họ khát khách hơn). Do đó, Scale đối mặt nguy cơ biên lợi nhuận giảm nếu phải hạ giá hoặc tăng chi phí giữ chất lượng. Ngoài ra, khi mở rộng sang sản phẩm ML (như nền tảng GenAI), Scale cạnh tranh với những công ty đã có chỗ đứng (như Databricks, Snorkel AI trong mảng nền tảng ML, hay chính các cloud providers). Những đối thủ này có lợi thế riêng (VD: Databricks có nền tảng data lakehouse lớn sẵn, AWS/Google Cloud thì tích hợp dọc tất cả dịch vụ cloud)↗↗. Scale AI phải thuyết phục khách rằng giải pháp của mình đáng để trả thêm chi phí tách rời khỏi hệ sinh thái sẵn có của cloud. Nếu không, khả năng cạnh tranh ngoài mảng cốt lõi sẽ khó khăn. Tựu trung, cạnh tranh gay gắt có thể dẫn tới “cuộc chiến giá” và làm suy yếu tăng trưởng của Scale nếu không có chiến lược khác biệt hóa rõ ràng.
-
Rủi ro pháp lý và địa chính trị: Vì làm việc với dữ liệu lớn, Scale AI chịu ảnh hưởng bởi các quy định về dữ liệu trên thế giới. Chẳng hạn, quy định GDPR và Đạo luật AI của EU yêu cầu dữ liệu người dùng châu Âu phải lưu trữ tại chỗ, hạn chế chuyển ra ngoài↗. Điều này gây khó cho mô hình kinh doanh toàn cầu của Scale – họ không thể dễ dàng dùng workforce ở châu Phi/ châu Á để gán nhãn dữ liệu châu Âu nếu vi phạm luật. Công ty có thể phải mở trung tâm dữ liệu và thuê nhân lực tại châu Âu, làm tăng chi phí. Tương tự, các quy định về AI có thể giảm nhu cầu (ví dụ nếu EU hạn chế mạnh AI nguy cơ cao, thị trường ứng dụng AI thu hẹp thì nhu cầu data labeling cũng giảm)↗. Về địa chính trị, việc Scale AI làm sâu với quốc phòng Mỹ có thể cản trở cơ hội ở các thị trường khác (Trung Quốc chắc chắn không dùng Scale, thậm chí EU có thể e dè nếu coi đây là nhà thầu quân sự Mỹ). Ngược lại, nếu có biến động như suy thoái kinh tế buộc chính phủ Mỹ cắt ngân sách công nghệ, các hợp đồng quốc phòng cũng có thể bị ảnh hưởng.
-
Rủi ro công nghệ thay thế: Paradigm của AI có thể thay đổi sao cho nhu cầu gán nhãn thủ công giảm đi. Ví dụ, các kỹ thuật học không cần giám sát (self-supervised learning), học từ dữ liệu tổng hợp (synthetic data) ngày càng phát triển, có thể làm thị trường labeling truyền thống thu hẹp. Nếu mô hình tương lai có thể tự tạo và gắn nhãn dữ liệu giả lập một cách đáng tin cậy, nhu cầu con người gán nhãn thật sẽ giảm đáng kể. Ngay chính Scale AI trước đây cũng thử cung cấp Synthetic data (mô phỏng ảnh, video) để huấn luyện mô hình mà không cần dữ liệu thực↗. Hiện tại phương pháp này chưa thay thế hoàn toàn dữ liệu thực, nhưng trong 5-10 năm tới là ẩn số. Scale AI phải tiếp tục đầu tư vào R&D AI để không bị bỏ lại – có lẽ đó là lý do họ tập trung phát triển mảng GenAI và Evaluation, nơi giá trị gia tăng cao hơn so với công việc labeling cơ bản.
Tóm lại, Scale AI đang ở vị thế dẫn đầu nhưng cũng phải vật lộn với nhiều rủi ro trên các mặt: nhân sự lãnh đạo, niềm tin khách hàng, cạnh tranh thị trường, luật lệ và xu hướng công nghệ. Khả năng ứng phó với những thách thức này sẽ quyết định liệu công ty có giữ vững “hào lũy” (moat) của mình và tiếp tục tăng trưởng như kỳ vọng hay không.
6. Góc nhìn nhà đầu tư & bài học cho startup Việt Nam
Từ góc độ nhà đầu tư mạo hiểm, câu chuyện của Scale AI đem lại nhiều bài học giá trị:
-
“Picks and Shovels” cho kỷ nguyên AI: Thay vì cạnh tranh trực tiếp làm sản phẩm AI cuối cùng, Scale AI chọn phục vụ nhu cầu hạ tầng thiết yếu (dữ liệu) cho mọi người làm AI. Giống như thời kỳ đào vàng, người bán cuốc xẻng có thể thắng lớn – Scale AI đã trở thành người bán “dữ liệu đã gắn nhãn” cho hầu hết các tay chơi AI lớn↗. Nhà đầu tư đánh giá cao mô hình này vì thị trường địa chỉ rộng (AI nào cũng cần dữ liệu) và vai trò bền vững trong chuỗi giá trị AI. Bài học cho startup Việt Nam: hãy nhìn vào hệ sinh thái công nghệ để tìm ra điểm nghẽn chung mà nhiều người gặp phải, giải quyết tốt điểm nghẽn đó sẽ tạo ra doanh nghiệp giá trị cao. Đặc biệt trong AI/Data, vẫn còn nhiều “đất trống” để cung cấp dịch vụ hỗ trợ (annotation, tối ưu mô hình, AI ops, v.v.).
-
Kết hợp nhân lực & công nghệ để tạo lợi thế chi phí: Scale AI tận dụng cả lao động giá rẻ ở các nước đang phát triển lẫn công nghệ ML tự động hóa để đạt hiệu quả vượt trội↗↗. Mô hình “human-in-the-loop” của họ vừa tạo việc làm cho hàng trăm ngàn người, vừa liên tục cải tiến thuật toán. Đây là một dạng innovative outsourcing: không chỉ gia công mà còn phát triển sản phẩm trên đó. Việt Nam có lực lượng nhân lực CNTT dồi dào, nếu biết kết hợp với công nghệ thông minh, ta có thể xây dựng dịch vụ tương tự phục vụ thị trường quốc tế. Bài học là: đừng coi thường lợi thế nhân lực địa phương, hãy dùng nó như một phần của công nghệ, không chỉ đơn thuần làm thuê.
-
Tăng trưởng nhanh nhờ “đốt vốn” chiến lược: Từ góc nhìn VC, Scale AI là ví dụ cho thấy khi thấy cơ hội thị trường rất lớn, việc chấp nhận lỗ và huy động thật nhiều vốn để mở rộng nhanh có thể là chiến lược đúng. Công ty đã liên tục gọi các vòng “khủng” (100M, 155M, 325M, 1B…)↗ và dùng tiền đó để tuyển dụng nhân tài (kỹ sư, nhà nghiên cứu), xây dựng hạ tầng và thâu tóm thị phần trước khi đối thủ kịp lớn. Kết quả là họ chiếm được những khách hàng hàng đầu và tạo rào cản đáng kể. Dĩ nhiên, việc “đốt tiền” này có rủi ro nếu thị trường đảo chiều – như giai đoạn 2022–2023 lãi suất tăng, Scale AI cũng phải thu hẹp một chút (sa thải 20%)↗. Bài học: Startup muốn tăng trưởng đột phá cần có tầm nhìn lớn và sự hỗ trợ của vốn đầu tư mạo hiểm. Khi cửa sổ cơ hội mở ra (như AI đang bùng nổ), tốc độ trở nên quan trọng – sẵn sàng hy sinh lợi nhuận ngắn hạn để xây dựng vị thế dẫn đầu dài hạn.
-
Tập trung vào chất lượng và giá trị, không cạnh tranh giá rẻ: Scale AI chọn phân khúc khách hàng cao cấp, chấp nhận cung cấp dịch vụ đắt tiền nhưng chất lượng vượt trội (99%+ chính xác, SLA cao)↗↗. Cách tiếp cận “premium” này giúp họ tránh bẫy cuộc đua xuống đáy về giá – thứ đã khiến Appen lao đao (giảm giá trị)↗. Nhà đầu tư thích các công ty có moat chất lượng vì biên lợi nhuận tốt hơn và khách hàng trung thành hơn. Startup Việt Nam thường cạnh tranh bằng giá rẻ, nhưng bài học ở đây là: nếu nhắm thị trường toàn cầu, hãy cố gắng vươn lên bằng chất lượng và sự khác biệt. Giá rẻ có thể thu hút ban đầu nhưng về lâu dài khó giữ chân khách và không tạo được định giá cao.
-
Nhạy bén nắm bắt xu hướng mới: Scale AI không “ngủ quên” trên thành công gán nhãn xe tự lái, họ nhanh chóng pivot khi thị trường LLM nổi lên – ra mắt Spellbook hỗ trợ LLM, tham gia RLHF cho OpenAI↗, hay khi AI an toàn trở thành vấn đề nóng thì lập SEAL lab và leaderboards↗. Sự linh hoạt này rất quan trọng trong lĩnh vực công nghệ biến đổi nhanh. Nhà đầu tư đánh giá cao đội ngũ biết liên tục đổi mới và mở rộng sản phẩm theo nhu cầu thị trường. Thông điệp cho startup Việt: phải luôn theo dõi xu hướng công nghệ (VD: năm nay LLM, năm sau có thể là AI đa phương thức, hoặc quy định AI…), chủ động điều chỉnh chiến lược kịp thời sẽ tăng cơ hội thành công.
-
Cân nhắc kỹ đối tác chiến lược và cấu trúc sở hữu: Thương vụ Meta cho thấy mặt trái của việc để một công ty lớn nắm cổ phần đáng kể: có tiền và tài nguyên, nhưng cũng mất độc lập và gây xung đột lợi ích. Từ góc độ đầu tư, việc bán gần 50% công ty với định giá cao có lợi tài chính, nhưng kéo theo hệ quả làm suy giảm giá trị công ty (mất khách hàng, mất founder). Đây là bài học đắt giá: chọn nhà đầu tư phù hợp quan trọng không kém giá tiền. Startup Việt Nam khi huy động vốn cần xem xét không chỉ số tiền mà cả động cơ và ảnh hưởng của nhà đầu tư đến các bên liên quan khác. Đôi khi nhận ít tiền hơn nhưng từ đối tác trung lập, hỗ trợ lâu dài sẽ tốt hơn tiền nhiều nhưng ràng buộc tay chân.
Tựu trung, hành trình của Scale AI dạy chúng ta rằng: giải quyết vấn đề gốc rễ của ngành sẽ tạo nên doanh nghiệp vĩ đại; kết hợp trí óc con người và công nghệ có thể tạo đột phá; tư duy toàn cầu và táo bạo giúp startup vươn xa; nhưng cũng phải luôn giữ vững niềm tin khách hàng và uy tín trung lập khi đóng vai trò hạ tầng. Với Việt Nam – một quốc gia có nguồn nhân lực CNTT dồi dào và chi phí hợp lý – hoàn toàn có cơ hội để tạo ra “Scale AI phiên bản Việt” phục vụ khu vực, bằng cách tập trung vào một mảng hạ tầng AI nào đó (ví dụ: gán nhãn dữ liệu tiếng Việt/châu Á, kiểm thử mô hình AI địa phương, v.v.) và áp dụng những bài học kể trên. Quan trọng nhất, startup cần tư duy lớn và học hỏi nhanh từ các tiền bối như Scale AI, để có thể tham gia vào chuỗi giá trị AI toàn cầu và đạt được thành công đột phá.
Nguồn tài liệu tham khảo: Các thông tin và số liệu trong phân tích trên được tổng hợp từ nhiều nguồn uy tín, bao gồm bài nghiên cứu của Contrary Research↗↗, các bài báo tài chính – công nghệ (Reuters↗↗, Bloomberg↗, TechCrunch↗, Forbes), cùng nguồn tin trong nước↗↗. Những nguồn này đã được trích dẫn trực tiếp tại các phần tương ứng để đảm bảo tính xác thực và dễ kiểm chứng của thông tin.
