Top 4 'con át chủ bài' của Trung Quốc trong cuộc cạnh tranh mô hình ngôn ngữ lớn thế giới

Với những bước chuyển mình trong cuộc chiến phát triển mô hình ngôn ngữ lớn thế giới, Trung Quốc đang dần khẳng định vị thế của mình trước những đối thủ tầm cỡ phương Tây.

Upload image

Tên ModelERNIE 3.0 TitanTongyi QianwenPangu Models 3.0Hunyuan
Tên tiếng Trung文心通义千问盘古混元
Tên Hán ViệtVăn TâmThông Nghĩa Thiên VấnBàn CổHỗn Nguyên
Nhà phát triểnBaiduAlibabaHuaweiTencent
Tham số260 tỷChưa được công bốNhiều kích thước100 tỷ

Trong những năm gần đây, xu hướng công nghệ thế giới đang dịch chuyển sang chạy đua phát triển các mô hình ngôn ngữ lớn (Large Language Model). Khi cả thế giới phát sốt với những bước tiến đáng kinh ngạc của các mô hình ngôn ngữ lớn như GPT, PaLM, LlaMA,… ta có thể thấy hầu hết những thành công vang dội trong lĩnh vực này đều đến từ các nước phương Tây. Trước bối cảnh đó, chính phủ và các công ty công nghệ Trung Quốc cũng đã bắt đầu tham chiến bằng những nỗ lực nghiên cứu và phát triển công nghệ này, đồng thời đạt được những tiến bộ đáng kể.

Theo số liệu gần đây từ Bộ Khoa học và Công nghệ Trung Quốc, Hoa Kỳ và Trung Quốc cùng chiếm hơn 80% tổng số mô hình ngôn ngữ lớn trên thế giới, trong đó Hoa Kỳ dẫn đầu về số lượng và Trung Quốc nhanh chóng bắt kịp đà tăng trưởng kể từ năm 2020.

Hãy cùng Atekco điểm danh những mô hình ngôn ngữ lớn nổi bật tính đến năm 2023 của đất nước tỷ dân này nhé.

1. Baidu, ERNIE 3.0 Titan (文心/Văn Tâm)

Là một trong những công ty công nghệ tiên phong tại Trung Quốc tham gia vào nghiên cứu và phát triển mô hình lớn, Baidu là công ty ra mắt mô hình tiền huấn luyện chính thức đầu tiên của Trung Quốc với ERNIE 1.0 vào tháng 3 năm 2019. Sau quá trình hơn 3 năm liên tục đầu tư cải tiến, mô hình này hiện đã được nâng cấp lên phiên bản ERNIE 3.0 Titan gồm 260 tỷ tham số, lớn hơn 50% so với ChatGPT.

Upload image

Sự kiện ra mắt ERNIE Titan 3.0

Giữa cuộc cạnh tranh AI với các nhà phát triển trong nước, Baidu dẫn đầu cuộc chạy đua bằng sản phẩm chatbot được xây dựng trên mô hình ERNIE 3.0 Titan mang tên Ernie Bot (tên tiếng Trung là Wen Xin Yi Yan/文心一言/Văn Tâm Nhất Ngôn) với độ hoàn thiện cao và được ví như "phiên bản Trung Quốc của ChatGPT".

Một điều thú vị về ERNIE 3.0 Titan là nó hỗ trợ cả hai ngôn ngữ Tiếng Anh và Tiếng Trung đồng thời là mô hình đa phương thức (multimodal). Điều này có nghĩa là ngoài khả năng tạo sinh ngôn ngữ, mô hình này còn có khả năng chuyển đổi văn bản thành hình ảnh và được ứng dụng để cho ra đời công cụ ERNIE-ViLG 2.0. Kết quả đánh giá cho thấy ERNIE-ViLG 2.0 có hiệu năng vượt trội hơn những phương thức chuyển văn bản sang hình ảnh gần đây như DALL-E 2 và Stable Diffusion dựa trên khả năng cải thiện chất lượng và độ chân thực của hình ảnh được tạo ra. Sự hoàn chỉnh của các sản phẩm này đã phản ánh rõ ràng quá trình đầu tư bài bản và mạnh mẽ của gã khổng lồ công nghệ Trung Quốc vào việc phát triển và ứng dụng mô hình ngôn ngữ lớn.

2. Alibaba, Tongyi Qianwen (通义千问/Thông Nghĩa Thiên Vấn)

Mô hình ngôn ngữ lớn Tongyi Qianwen lần đầu tiên được Alibaba Cloud ra mắt trong giới công nghệ Trung Quốc vào đầu tháng 4 năm nay. Mô hình này được xem là con át chủ bài của Alibaba trong việc cạnh tranh với ChatGPT của phương Tây. Tongyi Qianwen sẽ được tích hợp trong hệ sinh thái các nền tảng ứng dụng của Tập đoàn Alibaba trong thời gian gần nhằm nâng cao trải nghiệm người dùng, từ lĩnh vực truyền thông doanh nghiệp, trợ lý giọng nói ảo, thương mại điện tử, công cụ tìm kiếm cho đến giải trí. Trước hết, mô hình này sẽ được áp dụng vào DingTalk - môi trường làm việc ảo và nền tảng phát triển ứng dụng của Alibaba, cùng với Tmall Genie - nền tảng doanh nghiệp cung cấp thiết bị nhà thông minh dựa trên IoT.

  • DingTalk tích hợp Tongyi Qianwen được thiết kế để giúp việc giao tiếp nơi công sở trở nên hiệu quả hơn. Ví dụ, nó có thể tóm tắt các ghi chú cuộc họp, chuyển đổi hội thoại trong cuộc họp thành văn bản, soạn thảo email và đưa ra các đề xuất kinh doanh hoặc xây dựng kế hoạch chiến dịch quảng cáo thông qua một vài câu lệnh đơn giản. Đặc biệt hơn, người dùng còn có thể tạo nhanh một ứng dụng nhỏ trên DingTalk bằng cách chụp lại ý tưởng nháp được viết trên giấy.
  • Tmall Genie tích hợp Tongyi Qianwen sẽ có thể giúp cải tiến các tính năng hiện có bằng cách giao tiếp sống động và tự nhiên hơn với người dùng Trung Quốc. Ví dụ, nó có thể kể chuyện cho trẻ nhỏ, cung cấp những công thức nấu ăn lành mạnh, đưa ra các tip du lịch hay gợi ý các bài hát phù hợp khi tập luyện thể dục.

Bên cạnh đó, Alibaba cũng mong muốn thúc đẩy sự phát triển của công cuộc đổi mới lấy AI làm trung tâm tại Trung Quốc bằng cách cho phép các đối tác truy cập mô hình Tongyi Qianwen bản thử nghiệm beta trên cloud và giúp họ xây dựng các mô hình ngôn ngữ lớn theo nhu cầu. Khả năng đa phương thức bao gồm nhận biết hình ảnh và chuyển văn bản thành hình ảnh cũng sẽ sớm được phát triển cho Tongyi Qianwen nhằm giúp người dùng có thể trải nghiệm thêm nhiều tính năng AI khác.

Upload image

Giám đốc điều hành của Alibaba Cloud Intelligence, Daniel Zhang, công bố mô hình AI mới để hỗ trợ chuyển đổi trí tuệ của doanh nghiệp

3. Huawei, Pangu Models 3.0 (盘古/Bàn Cổ)

Tại sự kiện thường niên HUAWEI Developer Conference diễn ra vào ngày 7 tháng 7 năm 2023, Huawei Cloud đã trình làng dòng mô hình ngôn ngữ lớn mới nhất do họ phát triển là Pangu Models 3.0.

Upload image

Zhang Ping'An, Giám đốc điều hành Huawei và Giám đốc điều hành Huawei Cloud, công bố Pangu Models 3.0

Ông Zhang Ping'An, Giám đốc điều hành của Huawei Cloud cho biết, Pangu Models 3.0 bao gồm ba lớp kiến trúc “5+N+X” như sau:

  • Lớp L0: Gồm 5 mô hình nền tảng là NLP (mô hình lớn xử lý ngôn ngữ tự nhiên), CV (mô hình lớn trực quan), multimodal (mô hình lớn đa phương thức), prediction (mô hình lớn dự đoán) và scientific computing (mô hình lớn điện toán khoa học) nhằm cung cấp kỹ năng tổng thể cho các ứng dụng trong nhiều lĩnh vực. Trong đó, mô hình ngôn ngữ lớn Pangu NLP được coi là mô hình AI chạm ngưỡng khả năng hiểu tiếng Trung của con người. Khác với các mô hình AI nước ngoài như ChatGPT, dòng mô hình ngôn ngữ lớn Pangu của Huawei được thiết kế tối ưu hóa cho ngôn ngữ Trung Quốc.
  • Lớp L1: Lớp L1 bao gồm N mô hình phù hợp với các ngành cụ thể. Huawei Cloud có thể cung cấp cho khách hàng mô hình riêng cho các ngành mà họ đã đào tạo dựa trên các bộ dữ liệu mở của lĩnh vực tương ứng. Ở cấp độ L1, Huawei đã tung ra các mô hình ngôn ngữ lớn cho lĩnh vực cụ thể như Pangu Financial (Tài chính), Pangu Mining (Khai thác mỏ), Pangu Meteorology (Khí tượng), Pangu Power (Năng lượng),… Ngoài ra, khách hàng cũng có thể tự huấn luyện mô hình bằng cách sử dụng bộ dữ liệu của riêng họ dựa trên các mẫu Pangu L0 hoặc L1 của Huawei.
  • Lớp L2: Mô hình dành riêng cho từng kịch bản chuyên biệt. Trong phân khúc L2, Huawei đã giới thiệu nhiều ứng dụng khác nhau dựa trên các mô hình ngôn ngữ lớn Pangu. Trong đó bao gồm ứng dụng dự báo khí tượng ngắn hạn và dự báo bão dựa trên mô hình lớn khí tượng, kiểm tra mức năng lượng của máy bay không người lái, nhận dạng sự cố điện dựa trên mô hình lớn năng lượng,… cùng hàng loạt giải pháp dựa trên mô hình ngôn ngữ lớn Pangu cho nhiều kịch bản cụ thể khác.

Pangu Models 3.0 được xây dựng với nhiều kích cỡ tham số khác nhau như 10 tỷ, 38 tỷ, 71 tỷ và 100 tỷ, đáp ứng nhu cầu đa dạng của khách hàng cùng các tiêu chuẩn khác nhau về độ trễ và thời gian phản hồi. Đồng thời, các bộ khả năng hoàn toàn mới cũng được cung cấp, chẳng hạn như tra vấn kiến thức, xây dựng kịch bản quảng cáo hay viết code đối với mô hình Pangu NLP; sáng tạo hình ảnh đối với mô hình Pangu đa phương thức. Tất cả các bộ công cụ này sẽ được cung cấp cho khách hàng và đối tác một cách nhất quán bất kể kích thước mô hình (số lượng tham số).

Huawei cho biết Pangu hiện đã được sử dụng trong hơn 10 lĩnh vực như tài chính, sản xuất, chính phủ, điện, khai thác than, y tế, đường sắt và hỗ trợ triển khai các ứng dụng AI trong hơn 400 kịch bản kinh doanh chuyên biệt.

4. Tencent, Hunyuan (混元/Hỗn Nguyên)

Vào ngày 7 tháng 9 năm 2023, Tencent đã ra mắt mô hình nền tảng độc quyền của mình là Hunyuan tại sự kiện Global Digital Ecosystem Summit tổ chức tại Thâm Quyến. Hiện tại, Hunyuan đã cho phép các doanh nghiệp ở Trung Quốc thử nghiệm và xây dựng ứng dụng thông qua API trên Tencent Cloud.

Upload image

Tencent ra mắt mô hình ngôn ngữ lớn Hunyuan vào đầu tháng 9 năm nay

Mô hình nền tảng của Tencent hỗ trợ một loạt chức năng bao gồm tạo hình ảnh, viết nội dung, nhận dạng văn bản, dịch vụ khách hàng cùng một số chức năng khác. Đây sẽ là công cụ hữu ích cho các lĩnh vực như tài chính, dịch vụ công cộng, truyền thông xã hội, thương mại điện tử, giao thông vận tải, giải trí,…

Hiện tại, Hunyuan đã được kết nối với 50 sản phẩm của chính Tencent, bao gồm Tencent Cloud, Tencent Marketing Solutions, Tencent Games, dịch vụ fintech của Tencent, Tencent Meeting, Tencent Docs, Weixin Search, QQ Browser và các dịch vụ cốt lõi khác.

Một số ứng dụng Hunyuan trong thực tế:

  • Phần mềm họp trực tuyến Tencent Meeting tích hợp trợ lý AI Hunyuan có thể thực hiện các tác vụ phức tạp như tạo biên bản cuộc họp bằng cách xử lý các câu lệnh từ người dùng.
  • Tencent Docs, hiện được tích hợp với Hunyuan, có thể soạn thảo nội dung và định dạng văn bản chuẩn chỉnh chỉ bằng một cú nhấp chuột.
  • Trong lĩnh vực quảng cáo, Hunyuan có thể hỗ trợ sáng tạo nội dung như giúp tạo ra những hướng dẫn mua sắm thú vị mà người bán có thể sử dụng để quảng cáo.

Theo ông Jie Jiang, Phó chủ tịch của Tencent, tập đoàn này đã chính thức bước vào kỷ nguyên “nắm bắt toàn diện các mô hình lớn”, phản ánh trong việc Tencent đã trưởng thành qua các giai đoạn từ phát triển thuật toán mô hình (model algorithms) đến khung học máy (machine learning frameworks) và hiện tại là cơ sở hạ tầng AI (AI infrastructure) với sản phẩm tân tiến nhất là mô hình Hunyuan có hơn 100 tỷ tham số và hơn 2 nghìn tỷ token trong dữ liệu tiền huấn luyện (pre-training).

Đặt trong tương quan với các sản phẩm đối thủ phương Tây, Tencent cho biết mô hình của họ có khả năng trò chuyện bằng cả tiếng Trung và tiếng Anh với hiệu suất tốt hơn ChatGPT của OpenAI trong các lĩnh vực như viết văn bản dài hàng nghìn từ và giải một số bài toán nhất định.

Tencent cũng cho biết thêm, mô hình này ít bị “ảo giác" hơn 30% so với Llama 2. Đây là hiện tượng các mô hình AI đưa ra thông tin không chính xác nhưng lại trình bày như thật.

Lời kết

Kỷ nguyên của trí tuệ nhân tạo đã bắt đầu và Trung Quốc đang sẵn sàng nắm lấy cơ hội này. Bằng những nỗ lực cao độ trong cuộc đua phát triển mô hình ngôn ngữ lớn để cạnh tranh trực tiếp với các đối thủ phương Tây, Trung Quốc đã ra mắt những sản phẩm chất lượng, góp phần định hình lại hoạt động của nhiều ngành công nghiệp quan trọng, mang lại đa dạng lợi ích cho xã hội và khẳng định vị thế của quốc gia này trong lĩnh vực trí tuệ nhân tạo trên thế giới.

Atekco - Home for Authentic Technical Consultants