Tiền dường như không còn là vấn đề khi các doanh nghiệp cả lớn và nhỏ của Trung Quốc đều chạy đua phát triển công nghệ chatbot.
Cơn sốt AI do ChatGPT tại Trung Quốc
Trong tháng 2, chỉ ít lâu sau khi ChatGPT của OpenAI khiến cho cả thế giới công nghệ phải choáng ngợp, hàng loạt bài đăng của doanh nhân Trung Quốc Wang Huiwen đã gây sốt trên mạng xã hội.
“Tôi đang đầu tư 50 triệu USD. Hãy hợp tác cùng tôi để đón chờ kỷ nguyên mới và tạo nên OpenAI của Trung Quốc. Tôi hiện giờ chưa hiểu công nghệ trí tuệ nhân tạo (AI), nhưng tôi đang cố hết sức để học hỏi”, ông Wang, người đồng sáng lập nền tảng giao đồ ăn Meituan, nói trong một bài đăng.
Một số nhà phân tích tỏ ý hoài nghi, chỉ ra rằng 50 triệu USD chỉ là một giọt nước trên biển nếu so với các khoản đầu tư cần có để huấn luyện các chatbot như ChatGPT.
Tuy nhiên, ông Wang chỉ là một trong số nhiều nhà đầu tư Trung Quốc đang chạy đua để sở hữu AI tạo sinh (generative AI), và nhiều người đang tập trung vào một lĩnh vực cụ thể: các mô hình ngôn ngữ lớn (LLM).
LLM là công nghệ hỗ trợ các chatbot như ChatGPT và Bard của Google. Sử dụng các thuật toán và sức mạnh điện toán tiên tiến, những mô hình này được huấn luyện dựa trên một lượng lớn bộ dữ liệu để sinh ra những câu trả lời giống như con người.
Trong 3 tháng qua, hơn 20 tổ chức của Trung Quốc đã tuyên bố họ đang phát triển LLM. Những tổ chức này bao gồm các tập đoàn công nghệ khổng lồ như Alibaba, Tencent, Baidu và Huawei Technologies; cũng như các trường đại học, tổ chức nhà nước và những doanh nhân vẫn còn chưa hiểu rõ về AI, như ông Wang.
“Hàng chục công ty Trung Quốc đang chạy đua để xây dựng các mô hình nền tảng cho bất kỳ công nghệ mới nào có tiềm năng lớn. Sự bùng nổ những người chơi và sản phẩm mới sẽ kéo theo sự hợp nhất khi công nghệ trưởng thành và những bên thắng cuộc sẽ xuất hiện”, Andy Chun, phó chủ tịch Hiệp hội Máy tính Hong Kong, cho hay.
Ngưỡng đầu tư vào LLM tại Trung Quốc đã tăng từ 50 triệu USD lên 100 triệu USD kể từ đầu năm nay, các nhà đầu tư nói với Nikkei Asia.
Một nguyên nhân làm dấy lên làn sóng quan tâm và đầu tư chính là tiềm năng lớn trong thương mại. Thị trường phần mềm và ứng dụng AI của Trung Quốc được dự báo sẽ tăng 25% giá trị trong khoảng từ năm 2021 đến 2026, lên trên 21 tỉ USD, theo công ty nghiên cứu thị trường IDC.
Một nguyên nhân khác chính là do sự hấp dẫn của cách tiếp cận với LLM.
“Các chuyên gia tin rằng chúng ta đã bước vào một kỷ nguyên mới của LLM, và nhiều người cảm thấy rằng nó xứng đáng để xem xét lại và làm lại tất cả các sản phẩm từ đầu. Thay vì sử dụng các giao diện lập trình ứng dụng (API) hay tích hợp các hệ thống hiện có, chúng tôi có kế hoạch xây dựng lại và cấu hình lại hoàn toàn mọi sản phẩm”, người đồng sáng lập kiêm CEO Baidu Robin Li nói, thêm rằng “LLM đã làm thay đổi AI, và chúng sẽ sớm làm thay đổi thế giới”.
Cuộc chơi tốn kém
Các công ty không phải là bên duy nhất quan tâm tới AI, Với tầm quan trọng đối với an ninh quốc gia và cạnh tranh toàn cầu, chính phủ Trung Quốc đã đưa ra nhiều chính sách hỗ trợ ngành công nghiệp AI và đang cố gắng biến đất nước này thành nhà tiên phong trong lĩnh vực. Đầu năm nay, chính phủ Bắc Kinh cam kết hỗ trợ các công ty xây dựng LLM để cạnh tranh với ChatGPT.
Tuy nhiên, có thực tế rằng xây dựng LLM rất tốn kém, cả về tài chính lẫn các yếu tố môi trường. Khí thải carbon từ việc huấn luyện một mô hình đơn nhất có thể lên tới hàng trăm tấn, theo một báo cáo của trường ĐH Stanford.
Ở Mỹ, chỉ có các tay chơi công nghệ lớn mới đủ sức để phát triển LLM. Như trường hợp của OpenAI, công ty này nhận được sự hậu thuẫn tài chính từ Microsoft mới có thể phát triển sâu hơn ChatGPT.
Xiao Yanghua, giáo sư khoa học máy tính đến từ trường ĐH Fudan ở Thượng Hải, nói trong một bài đăng trực tuyến rằng hiện tại, các tổ chức của Trung Quốc mới chỉ đang hiệu chỉnh lại các mô hình nền tảng mã nguồn mở và sử dụng các API giá khá rẻ như ChatGPT để sinh ra dữ liệu nhằm “phát triển” các mô hình của riêng họ.
“Đó là lý do tại sao khi các bạn đặt câu hỏi cho một số LLM nội địa rằng “bạn là ai?”, nó sẽ trả lời rằng “tôi là ChatGPT””, ông Xiao cho hay.
Ông cũng chỉ trích việc đổ lượng tiền lớn vào phát triển AI. “Việc phát triển LLM hiện tại có thể gây ra lãng phí nguồn nhân lực, nguyên liệu và nguồn lực tài chính”, ông nói.
Đối diện nhiều thách thức
Việc đánh giá xem nguồn vốn đầu tư phát triển LLM đã mang lại kết quả hay chưa cũng không hề dễ dàng.
“Thách thức ở chỗ, những mô hình của Trung Quốc này chưa được công bố rộng rãi cho người dân sử dụng, bởi vậy khó để đánh giá xem liệu chúng có thể so sánh được với các mô hình tiên tiến như LLM của ChatGPT hay Bard không”, Paul Triolo, chuyên gia về công nghệ và Trung Quốc đến từ hãng tư vấn Albright Stonebridge, nhận định.
Theo ông Triolo, các công ty Trung Quốc thường có xu hướng đưa các mô hình AI tạo sinh của họ vào ngành dọc hoặc các thị trường mục tiêu, và sử dụng các bộ dữ liệu của riêng họ để phát triển nhanh chóng các ứng dụng có thể tạo ra doanh thu.
Lệnh hạn chế xuất khẩu các loại chip xử lý đồ hoạ tiên tiến, hay GPU, của Mỹ có thể không phải là vấn đề trong ngắn hạn, ông nói thêm, nhưng theo thời gian nó có thể khiến cho các công ty Trung Quốc khó làm việc do bị hạn chế phần cứng.
Thêm một thách thức nữa đối với các công ty Trung Quốc chính là các bộ dữ liệu, theo Qing Wei, giám đốc công nghệ của Microsoft tại Trung Quốc.
“Đối với các công ty công nghệ lớn ở Trung Quốc, khó có thể trao dữ liệu cho những đối thủ cạnh tranh hay kết nối với các API đối thủ, đó là lý do tại sao họ muốn xây dựng các mô hình của riêng họ nếu như sẵn sàng bước vào kỷ nguyên mới của AI”, ông nói thêm.
Mặc dù dữ liệu ngôn ngữ mà ChatGPT có thể trích xuất là mở, được chia sẻ và miễn phí, nhưng hầu hết dữ liệu ngôn ngữ chất lượng cao của Trung Quốc cần có để tạo ra một “phiên bản Trung Quốc của ChatGPT” lại bị nắm giữ bởi một số công ty và tổ chức, và không thể được chia sẻ, ông Wei cho hay.
Zeren Bai, nhân sự cấp cao tại Linear Capital, công ty chuyên đầu tư vào ứng dụng dữ liệu và cơ sở hạ tầng dữ liệu ở Trung Quốc, cho hay phần lớn các tập đoàn internet Trung Quốc đều đang phát triển các LLM của riêng họ, bởi họ có lợi thế tận dụng chính dữ liệu của họ.
Cuộc chiến AI: chỉ có vài kẻ sống sót
Bất chấp những trở ngại, ông Bai nói rằng kể từ khi ChatGPT ra đời, ngành này đã đạt được sự đồng thuận rằng việc làm lại tất cả các ứng dụng là xứng đáng.
“Các ứng dụng được xây dựng trên các mô hình nền tảng sẽ là một cơ hội khá chắc chắn, bởi vậy chúng tôi tập trung vào các ứng dụng AI tạo sinh theo ngành dọc, thay vì tập trung vào các nền tảng tập trung vào chat”, ông nói. Những ví dụ bao gồm sử dụng AI để tạo các bức ảnh hay đoạn video quảng cáo.
Và các LLM của Trung Quốc thực tế là đang phát triển và được cải thiện. Như Ernie Bot của Baidu, nó được xem là câu trả lời đầu tiên của Trung Quốc với ChatGPT. Con bot này vẫn đang trong quá trình thử nghiệm và chưa ra mắt công chúng, nhưng Baidu gần đây nói rằng số truy vấn của Ernie mỗi giây – cách đo lượng lưu lượng mà nó có thể xử lý – đã tăng gấp 10 lần kể từ khi ra mắt lần đầu tiên trong tháng 3.
Trong khi đó, Alibaba Cloud trong tuần này đã cho ra mắt chương trình trợ lý thông minh, Tingwu, dựa trên LLM Tongyi Qianwen của họ. Tingwu có thể chuyển đổi giọng nói và video sang văn bản theo thời gian thực, và đã cho người dân sử dụng để thử nghiệm beta.
Nhưng chính Tencent và Alibaba mới là những bên sở hữu nguồn lực tài chính dồi dào cùng với đội ngũ kỹ sư hùng hậu. Vậy những người đang ôm hy vọng, như ông Wang, sẽ đi đến đâu?
“Chỉ có một số ít tập đoàn công nghệ mới có thể giành chiến thắng cuối cùng trong cuộc chiến LLM. Giống như việc hàng nghìn công ty Trung Quốc đốt tiền để giành thị phần trong cuộc chiến mua theo nhóm hồi đầu những năm 2010, và chỉ có một nhóm sống sót”, James Chou, giám đốc quản lý Microsoft về Startup ở Bắc Á, nói.
“Tôi tin rằng sẽ có thêm nhiều sự phát triển sáng tạo hơn trong những ngành dọc hẹp và chuyên biệt, như một số công ty có thể tạo đòn bẩy dựa vào chuyên môn của họ trong một lĩnh vực cụ thể và lượng dữ liệu đặc thù mà họ sở hữu để tạo ra các mô hình mới”, theo ông Chou.
T.P