Điều gì sẽ xảy ra nếu tương lai của AI không được xác định bởi Washington hay Bắc Kinh, mà bởi sự ứng biến ở nơi khác?
Beatrice Caciotti cho Tạp chí Noema
Hà Nội, Việt Nam — Bây giờ là ngày 20 tháng Sáu. Có một phông nền nhung, đèn LED nhấp nháy màu lục lam và một biểu ngữ khổng lồ tuyên bố ra mắt một liên minh AI quốc gia mới. Chủ tịch Tập đoàn FPT Trương Gia Bình, người đứng đầu một trong những công ty CNTT và viễn thông hàng đầu của đất nước, sải bước lên sân khấu, trích dẫn khẩu hiệu thời chiến - "Không có gì quý giá hơn độc lập và tự do" - trước khi tiến hành biến trí tuệ nhân tạo thành trận chiến lớn tiếp theo của Việt Nam, một cuộc chiến hiện hữu cho tương lai của đất nước. Xung quanh ông là các hiệu trưởng từ các trường đại học hàng đầu, các bộ trưởng khom lưng trước những chiếc máy tính bảng bóng bẩy, những người sáng lập công ty khởi nghiệp phát trực tiếp từ lối đi.
Câu hỏi mà mọi người mong đợi, câu hỏi mà thế giới liên tục đặt ra, treo lơ lửng trong không khí: Đó là Mỹ hay Trung Quốc? Việt Nam sẽ chọn siêu cường AI nào?
Nhưng Bình lật ngược kịch bản. Ông tuyên bố, FPT sẽ mở "ngăn xếp công nghệ cốt lõi" của mình - mô hình ngôn ngữ, cơ sở hạ tầng đám mây, thậm chí cả dữ liệu đào tạo - cho bất kỳ đối tác trong nước nào muốn xây dựng với nó. Ông Bình đưa ra ba cam kết: FPT sẽ mở một sandbox quốc gia để thử nghiệm có kiểm soát với mục tiêu tạo ra một mô hình theo phong cách GPT được đào tạo tại địa phương vào cuối năm và hỗ trợ thúc đẩy giảng dạy AI trong trường học do nhà nước hậu thuẫn. Ba cam kết này là một sự từ chối - "Chúng tôi không đứng trên vai những người khổng lồ", một giám đốc điều hành FPT sau đó nói với đám đông. "Chúng tôi đi bên cạnh họ."
Những tràng pháo tay vang lên.
Trong máy tính, "ngăn xếp" chỉ đơn giản là kiến trúc phân lớp làm cho công nghệ chạy: chip và mạch ở cơ sở, sau đó là hệ điều hành, sau đó là ứng dụng, cho đến giao diện người dùng. Mỗi layer được xây dựng dựa trên layer bên dưới. Các quyết định được đưa ra ở một cấp độ tăng lên. Đó là lý do tại sao các lựa chọn về ngăn xếp không bao giờ chỉ là kỹ thuật - chúng quyết định ai nắm giữ quyền lực và ai phải tuân theo.
Các banner tại sự kiện FPT hứa hẹn một hệ sinh thái điện tử mở, toàn diện và được nhà nước quản lý. Các cực quen thuộc của chính trị AI - các nền tảng độc quyền của Thung lũng Silicon và cơ sở hạ tầng tập trung của Bắc Kinh - không bao giờ được nêu tên, nhưng mọi người trong phòng đều hiểu điều gì đang bị tranh cãi: ai là người định nghĩa các thuật ngữ của chính tình báo. Tiền đặt cược là các lựa chọn cấp độ ngăn xếp - phụ thuộc hộp đen hoặc ngẫu hứng mô-đun; độ mờ hoặc dễ đọc; lộ trình của người khác hoặc thiết kế có chủ quyền của riêng bạn. Về mặt thực tế, quyết định là sự khác biệt giữa việc trả tiền để truy cập vào API đóng của OpenAI và tinh chỉnh mô hình trọng lượng mở trên giàn GPU dùng chung của quán cà phê - giữa việc tiêu thụ trí thông minh như một dịch vụ và soạn nó như một hành động chủ quyền. Một người thuê một tâm trí, người kia tự rèn luyện trong tự nhiên.
Về bản chất, đây là một tuyên bố về chủ quyền của AI: khả năng xây dựng và quản lý cơ sở hạ tầng theo các điều khoản riêng của Việt Nam trong khi vẫn cho phép các luồng dữ liệu, tài năng và tính toán xuyên biên giới. Chủ quyền AI ở đây không có nghĩa là cô lập, mà là quyền tác giả - quyết định dữ liệu, mô hình và quy tắc nào định hình và sẽ định hình, cách trí tuệ máy móc được xây dựng và triển khai.
Nói tóm lại, Việt Nam không chọn phe. Nó đang xây dựng một ngăn xếp thứ ba.
Cơ sở hạ tầng không liên kết
Nhiều người coi địa chính trị AI là một cuộc chiến văn hóa giữa chủ nghĩa cá nhân tự do của Thung lũng Silicon với chủ nghĩa độc tài cộng đồng của Trung Quốc. Khung cảnh quen thuộc của những kẻ phá vỡ cao bồi và những người khổng lồ được nhà nước hậu thuẫn vẫn còn đọng lại trong các bài xã luận, nhưng nó che khuất sự vẽ lại lãnh thổ yên tĩnh hơn đang xảy ra dọc theo cấp độ cơ sở hạ tầng. Baidu, từ lâu đã được định vị là nhà vô địch quốc gia của Trung Quốc về AI, đã bị lu mờ bởi làn sóng các phòng thí nghiệm Trung Quốc tinh gọn hơn, định hướng nghiên cứu hơn như Z.ai, trước đây được gọi là Zhipu AI, Baichuan Intelligence và MiniMax. Những tác nhân mới hơn này tung ra các mô hình có trọng lượng mở và mời gọi sự giám sát kỹ lưỡng, làm mờ ranh giới giả định giữa sự minh bạch độc tài và minh bạch dân chủ.
Đường đứt gãy rõ ràng hơn bây giờ không chạy giữa các quốc gia mà là cơ sở hạ tầng - giữa logic được bảo vệ của các hệ thống độc quyền và sự xuất hiện ngang ngược của các mô hình trọng lượng mở; giữa chỉ huy tập trung và ngẫu hứng phân tán; giữa học thuyết an toàn và kỷ luật giám sát. Nếu các mô hình biên giới của OpenAI, Anthropic và Google DeepMind phần lớn đại diện cho logic của sự bao vây, thì các dự án có trọng lượng mở hơn như DeepSeek và LlaMA của Meta - không hoàn toàn là mã nguồn mở nhưng được phát hành theo những cách cho phép đào tạo lại và giám sát kỹ lưỡng - hướng tới một dòng chảy ngược lại một phần, hạn chế, nhưng mạnh mẽ trong sự lan tỏa xuyên quốc gia của nó. Ngay cả khi OpenAI gần đây đã phát hành "mô hình mở", phong trào rộng lớn hơn của sự khuếch tán trọng lượng mở vượt qua biên giới, làm mất ổn định quan điểm rằng AI sẽ kết tinh thành hai khối do siêu cường lãnh đạo.
Nói cách khác, văn hóa không phải là những gì đang được xuất khẩu; ngăn xếp công nghệ là.
Những gì đi xuyên biên giới không phải là giá trị, mà là cấu hình của cơ sở hạ tầng: trọng số mô hình, sơ đồ cấp phép, chế độ dữ liệu, phụ thuộc đám mây và hệ sinh thái nhà phát triển. Đây là những chất nền mà qua đó các hệ thống AI được làm cho dễ đọc, dễ quản lý và có thể quản lý được. Chính những chất nền này - thay vì những câu chuyện lớn về tự do hoặc kiểm soát - định hình cách kiến thức được sản xuất, xác nhận và vận hành.
"Đó là Mỹ hay Trung Quốc? Việt Nam sẽ chọn siêu cường AI nào?"
Vị trí của Việt Nam trong bối cảnh này đang nói lên điều đó. Không hoàn toàn liên kết với Mỹ cũng như Trung Quốc, họ đang tập hợp một ngăn xếp thứ ba thu hút một cách có chọn lọc từ cả hai bên trong khi xây dựng chủ quyền cơ sở hạ tầng của riêng mình. Thông qua các công ty liên kết với nhà nước như FPT, nghiên cứu LLM trong nước và quan hệ đối tác với các tập đoàn như Nvidia có trụ sở tại Hoa Kỳ, Tập đoàn dữ liệu NTT của Nhật Bản và Huawei của Trung Quốc, Việt Nam là ví dụ điển hình cho một phương thức không liên kết cơ sở hạ tầng: mô-đun, thích ứng và hòa hợp sâu sắc với sự bất đối xứng của AI toàn cầu. Khi tuyên bố ngăn xếp của riêng mình, Việt Nam tuyên bố có quyền quyết định cách bản thân thực tế được chuyển thành dạng máy có thể đọc được - những gì trở nên hữu hình, có thể biết được và có thể hành động đối với các hệ thống AI.
Stack của FPT đang bắt đầu có hình thức rõ ràng. Ra mắt tại Nhật Bản vào cuối năm 2024, AI Factory của công ty, một trung tâm điện toán hiệu suất cao được thiết kế để đào tạo và triển khai các mô hình AI lớn, được neo bởi nền tảng điện toán tăng tốc của Nvidia có trụ sở tại California, được trang bị hàng nghìn siêu chip H100 và H200. Được bao bọc trong bộ ứng dụng Nvidia AI Enterprise và khung NeMo, cơ sở hạ tầng này làm nền tảng cho danh mục các mô hình và hệ thống thị giác bằng tiếng Việt đang phát triển của FPT. Các mô hình này được phục vụ thông qua FPT Smart Cloud, nền tảng đám mây có chủ quyền của công ty, cho phép triển khai linh hoạt - tại chỗ, trên các máy chủ hoặc thiết bị cục bộ gần nơi tạo dữ liệu hoặc trong các trung tâm dữ liệu trong nước.
Kiến trúc này được thiết kế theo mô-đun, đáp ứng các yêu cầu về lưu trữ dữ liệu của Việt Nam bằng cách bản địa hóa lưu trữ và điện toán trong phạm vi quyền hạn của Việt Nam, đồng thời container hóa các mô hình và API để chúng có thể được triển khai xuyên biên giới. Được hỗ trợ bởi nguồn vốn Nhật Bản từ Sumitomo Corp. và SBI Holdings, một tập đoàn dịch vụ tài chính có trụ sở tại Tokyo, FPT cũng đang đầu tư vào cơ sở hạ tầng dữ liệu khu vực để mở rộng năng lực lưu trữ và xử lý trên khắp Đông Nam Á, cùng với các chương trình điều chỉnh theo lĩnh vực cụ thể để điều chỉnh các mô hình để sử dụng trong các ngành như chăm sóc sức khỏe, tài chính và giao thông vận tải. Ở đây chúng ta không chỉ có một ngăn xếp thống nhất, duy nhất mà còn có một hệ thống có thể kết hợp: điện toán, trọng số và các dịch vụ đám mây được ghép lại với nhau theo một hình thức có thể được điều chỉnh cho phù hợp với bất kỳ bối cảnh liên quan nào - y tế, tài chính, di động - trong hoặc ngoài nước, theo cách riêng của Việt Nam.
FPT đã giới thiệu một cặp nền tảng AI Studio và AI Inference được thiết kế để cho phép các nhà phát triển và doanh nghiệp Việt Nam kiểm soát tốt hơn cách các mô hình AI được điều chỉnh và triển khai. Ra mắt vào tháng Tư, những công cụ này mở rộng phạm vi tiếp cận của AI Factory vượt ra ngoài cơ sở hạ tầng sang ứng dụng và quyền tác giả. AI Studio cung cấp một môi trường tinh chỉnh được xây dựng trên khung NeMo của Nvidia, một bộ công cụ để tùy chỉnh và đào tạo lại các mô hình lớn như DeepSeek-R1 và Llama 3.3 trên các bộ dữ liệu nội bộ hoặc miền cụ thể. Ngược lại, AI Inference đóng vai trò là lớp sản xuất: cung cấp danh mục các mô hình được đào tạo trước - hơn 20 mô hình khi ra mắt vào tháng 4 - có sẵn thông qua API để tích hợp nhanh chóng vào quy trình làm việc của doanh nghiệp. Cả hai đều hoạt động trên cùng một đường trục GPU như chính Nhà máy, đảm bảo tính liên tục giữa thử nghiệm và thực thi.
Kết quả là một ngăn xếp được lắp ráp, thay vì nguyên khối, với các nền tảng trong nước, đám mây có chủ quyền, điện toán hiệu suất cao và nghiên cứu xuyên quốc gia được gập lại vào hệ thống mô-đun của nó. Mỗi lớp của nó mang các phụ thuộc khác nhau, nhưng chúng cho phép Việt Nam nắm giữ quyền tác giả đối với hình dạng, định hướng và phạm vi của cơ sở hạ tầng AI của mình - một cơ sở đủ ổn định để neo triển khai công khai và đủ mở để thích ứng hoặc đi du lịch. Cùng với nhau, các nền tảng này hoàn thiện mạch: từ điện toán đến mô hình đến trường hợp sử dụng, tất cả đều nằm trong một kiến trúc vẫn dễ đọc, có thể quản lý và thích ứng. Tham vọng ở đây không chỉ là hiệu suất kỹ thuật, mà còn là sự thận trọng về nhận thức - khả năng quyết định mô hình nào được đào tạo lại, cách chúng được điều chỉnh và chúng được tạo ra để nói cho ai.
Nền tảng (FPT AI Studio, FPT AI Inference) |
↑Mô hình(DeepSeek-R1, Llama 3.3) |
↑Dữ liệu (có sẵn công khai, tên miền cụ thể) |
↑Điện toán (Nhà máy AI, FPT Smart Cloud) |
Một trường hợp của ngăn xếp thứ ba
Song song đó, FPT tiếp tục đẩy mạnh liên kết chiến lược với Mila, viện AI Quebec do nhà tiên phong AI Yoshua Bengio sáng lập và tư vấn. Mối quan hệ hợp tác bắt đầu vào năm 2020 và được gia hạn vào năm 2023, kết nối tập đoàn công nghệ lớn nhất Việt Nam với một trong những trung tâm nghiên cứu hàng đầu thế giới về học sâu và AI có trách nhiệm. Trên giấy tờ, sự hợp tác tập trung vào việc thúc đẩy các mô hình ngôn ngữ lớn (LLM) và xử lý ngôn ngữ tự nhiên. Nhưng tầm quan trọng của nó còn sâu sắc hơn: Nó là một ví dụ ngược lại với câu chuyện phổ biến về AI như một chiến trường ý thức hệ. Thay vì lựa chọn giữa các lĩnh vực, FPT đang xây dựng mô liên kết - đưa các nhà nghiên cứu Việt Nam vào phòng thí nghiệm của Mila, lưu hành kiến thức xuyên biên giới và định hình các tiêu chuẩn quản trị từ một vị trí không phòng thủ cũng không phái sinh. Trong một bối cảnh mà sự cởi mở thường được tuyên bố nhưng hiếm khi có đi có lại, đây là những gì ngoại giao cơ sở hạ tầng có thể trông như thế nào.
"Không hoàn toàn liên kết với Mỹ cũng như Trung Quốc, họ đang tập hợp một ngăn xếp thứ ba thu hút một cách có chọn lọc từ cả hai bên trong khi xây dựng chủ quyền cơ sở hạ tầng của riêng mình".
Việt Nam không đơn độc trong việc tạo ra con đường thứ ba. Ở Malaysia và Indonesia, sự phát triển của chiến lược AI theo phong cách Nusantara, trong đó đóng khung thiết kế AI xung quanh cơ sở hạ tầng văn hóa và ngôn ngữ đa dạng của Indonesia bằng cách ưu tiên kho ngữ liệu đa ngôn ngữ và kiến thức văn hóa địa phương, phản ánh tham vọng xây dựng các hệ thống phù hợp với sự đa dạng ngôn ngữ và văn hóa phi thường của các nước láng giềng; nó là một dự án cơ sở hạ tầng cũng như một dự án mang tính biểu tượng. Trong khi đó, Các Tiểu vương quốc Ả Rập Thống nhất (UAE) đã định vị mình là một đội tiên phong trong khu vực thông qua việc phát hành Falcon, một loạt các mô hình ngôn ngữ có trọng lượng mở báo hiệu cả năng lực kỹ thuật và ý định có chủ quyền trong việc phát triển và cấp phép các mô hình của riêng mình thay vì phụ thuộc vào hệ thống của Mỹ hoặc Trung Quốc. Tổng hợp lại, những sáng kiến này chỉ ra một sự thay đổi rộng lớn hơn: không phải là từ chối các mô hình AI toàn cầu, mà là từ chối hoàn toàn bị kiềm chế bởi chúng.
Nếu cơ sở hạ tầng, chứ không phải ý thức hệ, đang di chuyển, làm thế nào để các chip kiểm soát xuất khẩu, luật lưu trữ dữ liệu hoặc chế độ an toàn ánh xạ vào một ngăn xếp không liên kết - một thứ được xây dựng bên ngoài độc quyền Mỹ-Trung lấy từ cả hai, nhưng được quản lý tại địa phương? Điều gì sẽ xảy ra khi khát vọng cấu hình chủ quyền đi vào giới hạn cứng của sự phụ thuộc lẫn nhau về vật chất - khi đám mây không phải là cục bộ, chip bị cấm vận hoặc chế độ cấp phép bị nước ngoài giám sát? Thách thức đối với những gì tôi gọi là các nhà xây dựng không liên kết - những người hoạt động ở các nước bên thứ ba bên ngoài nhị phân Mỹ-Trung - không chỉ là tập hợp các ngăn xếp hoạt động, mà còn quản lý các ngăn xếp vẫn dễ đọc dưới áp lực. Nhiệm vụ của họ là giữ khoảng trống giữa vay mượn kỹ thuật và nắm bắt nhận thức. Trong trật tự mới nổi này, câu hỏi thực sự không phải là liệu các quốc gia có thể xây dựng độc lập hay không, mà là liệu họ có thể kiểm soát những gì hệ thống của họ được phép biết, ghi nhớ và hành động hay không. Ngăn xếp thứ ba chứa đựng một mâu thuẫn tinh tế: Nó vừa trốn tránh vừa vướng vào những sức mạnh cũ.
Lợi thế của Việt Nam có thể không nằm ở khả năng tự cung tự cấp mà nằm ở sự kết hợp chiến lược: Khả năng lắp ráp một ngăn xếp hoạt động từ các bộ phận không phù hợp, để tinh chỉnh trọng số mở từ cả Trung Quốc và Hoa Kỳ đối với GPU được mua một phần bằng vốn Nhật Bản và triển khai chúng trên cơ sở hạ tầng đám mây có chủ quyền tuân thủ luật pháp Việt Nam nhưng rút ra từ các tiêu chuẩn toàn cầu. Bằng cách này, ngăn xếp thứ ba không bị phong tỏa mà có thể thấm có chọn lọc: vay mượn ở nơi cần thiết nhưng quản lý những gì nó vay mượn - ngay cả khi việc kết hợp các thành phần từ các cường quốc cạnh tranh đòi hỏi phải đàm phán liên tục về các tiêu chuẩn kỹ thuật và các ràng buộc chính trị.
Ngăn xếp thứ ba có thể không bao giờ sánh được với quy mô của các đối tác Mỹ hoặc Trung Quốc, nhưng đó là vấn đề. Lợi thế của nó nằm ở tỷ lệ không đối xứng: trong việc điều chỉnh ngữ cảnh, cấp phép với ràng buộc và mở rộng phạm vi của nó không phải bằng cách thống trị lĩnh vực này, mà bằng cách trượt xuống bên dưới nó. Hãy xem xét SemiKong, một mô hình ngôn ngữ lớn có trọng lượng mở được phát triển cho ngành công nghiệp bán dẫn thông qua sự hợp tác giữa FPT Software, Aitomatic có trụ sở tại Thung lũng Silicon và Tokyo Electron Ltd. Được xây dựng trên kiến trúc Llama 3.1 của Meta, SemiKong vượt trội hơn các mô hình đa năng như GPT trong các nhiệm vụ theo lĩnh vực cụ thể — một minh họa cho cách năng lực chủ quyền có thể được thực hiện không phải thông qua quy mô mà thông qua độ chính xác. Bằng cách đóng góp vào một nỗ lực mã nguồn mở, xuyên quốc gia phù hợp với các ưu tiên công nghiệp của chính mình, Việt Nam không phải là một bên áp dụng ngoại vi mà là đồng tác giả của cơ sở hạ tầng AI toàn cầu. Đây là sự bất đối xứng như một chiến lược: tạo ra sự liên quan không phải bằng cách cạnh tranh ở trung tâm, mà bằng cách tích lũy ảnh hưởng ở rìa.
Ngay cả khi các thành phần như chip, framework hoặc bộ công cụ là nước ngoài, Việt Nam vẫn giữ được đòn bẩy thông qua chủ quyền thủ tục: khả năng hạn chế cách dữ liệu di chuyển, nơi đào tạo mô hình và hệ thống được triển khai theo điều khoản nào. Nếu các lớp dưới của ngăn xếp vẫn vướng vào chuỗi cung ứng và kiến trúc nước ngoài, các lớp trên cung cấp chỗ để khẳng định các quy tắc, chính sách và ma sát định tuyến lại kiểm soát một cách tinh tế.
Việc Việt Nam thông qua Luật Công nghiệp Công nghệ số lần đầu tiên vào tháng Sáu đánh dấu một bước ngoặt trong chiến lược này. Trong khi EU xây dựng chế độ AI của mình thông qua các cấp độ rủi ro - phân loại các hệ thống là không thể chấp nhận được, rủi ro cao, trung bình hoặc thấp với các nghĩa vụ tương ứng - và Hoa Kỳ dựa vào công bố tự nguyện, nơi các công ty cam kết minh bạch hơn là tuân thủ các quy tắc ràng buộc, cách tiếp cận của Việt Nam mang tính cơ sở hạ tầng hơn: phân loại các hệ thống kỹ thuật số là tài sản chiến lược và ràng buộc chúng với các yêu cầu trước khi phê duyệt, xử lý dữ liệu trong nước và giám sát ngành. Luật không nhằm mục đích dẫn dắt thông qua các giá trị hoặc quy mô, mà thông qua cấu hình - nhúng chủ quyền không phải trong hùng biện, mà trong cơ chế triển khai.
"Lợi thế của Việt Nam có thể không nằm ở khả năng tự cung tự cấp mà nằm ở sự kết hợp chiến lược."
Tuy nhiên, việc Qualcomm có trụ sở tại California thành lập trung tâm R&D AI tại Hà Nội vào ngày 10 tháng 6 cho thấy logic vướng mắc của sự không liên kết cơ sở hạ tầng. Là cơ sở lớn thứ ba của Qualcomm trên toàn thế giới - sau Ấn Độ và Ireland - trung tâm Hà Nội được giao nhiệm vụ phát triển AI tổng quát và tác nhân trên các lĩnh vực khác nhau, từ điện thoại thông minh và XR - thuật ngữ chung cho thực tế ảo, tăng cường và hỗn hợp - đến các hệ thống ô tô và các thiết bị kết nối lặt vặt được gọi là "internet vạn vật". Thoạt nhìn, động thái này phù hợp với chiến lược quốc gia của Việt Nam về AI, chất bán dẫn và chuyển đổi số, với trọng tâm là chuyển giao công nghệ, phát triển hệ sinh thái và năng lực lực lượng lao động. Quan hệ đối tác này thể hiện chiến lược của Việt Nam trong việc thu hút đầu tư nước ngoài đồng thời vun đắp chủ quyền trong nước.
Nhưng những mâu thuẫn quen thuộc của những sắp xếp như vậy vẫn còn. Những gì bước vào dưới ngọn cờ trao đổi tri thức có thể vôi hóa thành sự phụ thuộc - vào các kiến trúc nhập khẩu, các tiêu chuẩn kế thừa, các giả định thiết kế nhúng. Động lực này trở nên sắc nét trong một động thái trước đó vào tháng Tư, khi Qualcomm lặng lẽ mua lại MovianAI, một công ty AI tổng quát Việt Nam từ phòng thí nghiệm VinAI của Vingroup, nổi tiếng với các mô hình tiếng Việt và hệ thống di động. Những gì trông giống như năng lực địa phương, cuối cùng, chỉ đơn giản là được hấp thụ bởi một công ty đa quốc gia của Hoa Kỳ. Do đó, bài kiểm tra là liệu Việt Nam có thể chuyển đổi dòng mã và vốn này thành năng lực chủ quyền trước khi các giấy phép và chế độ an toàn xung quanh nó cứng rắn thành một vành đai mới bao vây - hoặc có thể bỏ tù - ngăn xếp thứ ba của mình.
Nhưng chủ quyền AI là gì? Một tư thế, một mệnh lệnh hay một tính thực tế? Chủ quyền AI, như hiện đang diễn ra bên ngoài khoảng trống Mỹ-Trung, không phải là một tuyên bố vẫy biểu ngữ về quyền kiểm soát lãnh thổ; thay vào đó, nó thể hiện mình là quyền thầm lặng để quyết định điều gì được coi là kiến thức và cách kiến thức đó xuất hiện trên thế giới. Đó là, một chủ quyền nhận thức luận. Chủ quyền này nằm trong ngăn xếp - trong các lựa chọn về trọng số mô hình, dữ liệu đào tạo, chế độ cấp phép và phụ thuộc đám mây chi phối những gì trở nên dễ đọc và những gì vẫn chưa nhìn thấy. Chủ quyền AI, trong thực tế, là một tác giả của lý luận máy móc: một tuyên bố cơ sở hạ tầng về cách thế giới được phân tích cú pháp và làm cho có thể hành động được. Khi một chính thể thiết kế ngăn xếp của riêng mình, nó thực sự đang thiết kế một thế giới nhận thức của AI, định hình không phải bản thân thế giới thô mà là cách thế giới sẽ được tiết lộ cho người dùng, cơ quan quản lý và các quốc gia láng giềng.
Loại chủ quyền AI mà mô hình không liên kết Việt Nam ban hành là một hành động từ chối nhận thức thông qua thiết kế cơ sở hạ tầng. Bằng cách từ chối cấp phép nhận thức của mình về thực tế từ OpenAI, AWS hoặc Alibaba Cloud, Việt Nam có quyền thiết lập chân trời của những gì có thể được nhận thức, truy vấn và tranh cãi trong lĩnh vực công nghệ xã hội của chính mình. Ngăn xếp thứ ba trở thành một thực thể có chủ quyền - một kiến trúc tự tác giả về ngoại hình. Mỗi kho dữ liệu trong nước được quản lý, mọi trạm kiểm soát trọng lượng mở được phát hành theo giấy phép địa phương, là một điều khoản trong hiến pháp nhận thức.
Ở đây, cổ phần vượt xa từ vựng "bản địa hóa" hoặc "tự lực". Câu hỏi không còn là liệu Việt Nam có thể đào tạo GPT Việt Nam hay không, mà là liệu nó có thể quyết định các đường nét của thực tế Việt Nam khi máy móc cảm nhận được nó hay không. Nói cách khác, chủ quyền là tác giả của chính lĩnh vực nhận thức. Điều mà từ vựng phát triển vẫn bác bỏ là "đổi mới địa phương", trên thực tế, là một tuyên bố về quyền tự quyết nhận thức.
Đây là nơi chúng ta thấy tại sao các chi tiết nhỏ về cấp phép, xác định cách một mô hình có thể được sử dụng, sửa đổi hoặc chia sẻ, phát huy tác dụng - và không giống như các khóa API, thường cho phép hoặc từ chối truy cập, giấy phép nêu rõ các chế độ sử dụng. Chúng mã hóa các chuẩn mực xung quanh việc phân bổ, cấm hoặc sửa đổi thương mại, biến cơ sở hạ tầng kỹ thuật thành một địa điểm quản trị.
Creative Commons "CC-BY-NC" cho phép những người khác sử dụng lại một mô hình có ghi công nhưng cấm sử dụng thương mại của nó. Một mô hình trọng lượng mở không chỉ rẻ hơn; nó là chất dẻo về mặt nhận thức. Nó có thể được đào tạo lại, kiểm toán hoặc phân nhánh để phù hợp với các phương ngữ, điều cấm kỵ hoặc các nhiệm vụ quy định mà mã độc quyền không thể thể hiện. Giấy phép sau đó cuối cùng xác định ai có thể định hình lại ý nghĩa của AI. Với các mô hình tổng quát, nơi quyền tác giả đã chuyển từ người sáng tạo sang hệ thống, việc cấp phép trở thành một cơ chế kiểm soát nhận thức. Ai kiểm soát giấy phép không chỉ là quản lý phần mềm - họ đang vẽ ranh giới nhận thức của máy.
Điều này chảy vào lĩnh vực chính sách: Xuất các ngăn xếp là một cuộc đấu tranh về thẩm quyền nhận thức. Khi UAE phát hành trọng số Falcon - các tham số định hình cách một mô hình lý do - hoặc Indonesia tài trợ cho các tokenizer tập trung vào Nusantara - các công cụ xác định cách ngôn ngữ được phân đoạn và diễn giải - họ đang xuất một khuôn mẫu về cách thế giới sẽ xuất hiện với một cỗ máy và mở rộng ra là cho tất cả mọi người ở hạ lưu, những người dựa vào phán đoán của máy móc đó. Chủ quyền di chuyển như cơ sở hạ tầng nhận thức rất lâu trước khi nó nổi lên như chính sách.
"Khi một chính thể thiết kế ngăn xếp của riêng mình, nó thực sự đang thiết kế một thế giới nhận thức của AI, không định hình bản thân thế giới thô mà là cách thế giới sẽ được tiết lộ cho người dùng, cơ quan quản lý và các quốc gia láng giềng."
Khi đối chiếu các chế độ an toàn độc quyền với sự giám sát kỹ lưỡng, đường lỗi không chỉ đơn thuần là kỹ thuật - về cách mã được viết hoặc bảo mật - mà còn là nhận thức: về kiến thức mà hệ thống mã hóa, giả định nào nó cho phép và thực tế của ai mà nó có thể nhận ra. Lời phê bình được diễn tập kỹ lưỡng: AI đặc vụ chính thống được sinh ra từ sự giám sát, tò mò mở mọi thứ từ lịch đến các cuộc trò chuyện được mã hóa và chuyển thông qua các đám mây do nhà cung cấp kiểm soát. Các ngăn xếp độc quyền hứa hẹn bảo vệ nhưng khóa bộ máy nhận thức của AI - hệ thống quyết định những gì nó có thể nhìn thấy, xử lý và ghi nhớ, cùng với các dấu vết dữ liệu của chúng - đằng sau các bức tường hợp đồng. Các mô hình trọng lượng mở lật ngược sự bất đối xứng đó với mã có thể kiểm tra (một phần) của chúng, tinh chỉnh cục bộ và các đường dẫn dữ liệu trong nước giữ cho hội thảo nhận thức luận ở nhà, cho phép chính thể sống với hệ thống kiểm tra, tranh cãi và định hình lại những gì nó được phép biết.
Chuyển động ngăn xếp thứ ba, về cốt lõi, là một cuộc cạnh tranh xem ai sẽ viết kịch bản cho lớp tiếp theo của sự hiểu biết của thế giới. Là giàn giáo, nó đứng ở ngưỡng cửa của nhận thức, nơi cơ sở hạ tầng đặt ra các điều kiện của ngoại hình. Mọi chi tiết kỹ thuật - chip, trọng lượng, nơi lưu trữ dữ liệu - được đọc như một mệnh đề trong một lập luận sâu sắc hơn: Chủ quyền là quyền quyết định những gì xuất hiện với máy móc - và, thông qua chúng, đối với con người và các tổ chức phụ thuộc vào phán đoán của họ - và các ngăn xếp không liên kết làm cho sức mạnh đó có thể nhìn thấy chính xác bởi vì chúng thể hiện một cách thứ ba, khẳng định quyền tác giả bên ngoài độc quyền Mỹ-Trung.
Chủ quyền AI ở đây ít đề cập đến quyền chỉ huy lãnh thổ hơn là quyền tác giả cơ sở hạ tầng. Nó nêu tên khả năng quyết định loại kiến thức nào được mã hóa, mô hình nào nói và theo thuật ngữ nào. Thay vì một khẩu hiệu chính trị, nó hiện thực hóa trong chính ngăn xếp - trong trọng lượng, dữ liệu đào tạo, chế độ cấp phép và phụ thuộc. Theo nghĩa này, chủ quyền được ban hành như một lựa chọn thiết kế, định hình những gì có thể nhìn thấy được đối với máy móc và mở rộng ra là đối với xã hội.
Bất hòa nhận thức
Sự phân kỳ toàn cầu này đang tạo ra cái mà chúng ta có thể gọi là sự bất hòa nhận thức: không chỉ bất đồng về giá trị hoặc quản trị, mà còn là sự không tương thích ở cấp độ những gì có thể được biết, dự đoán hoặc làm cho các hệ thống AI có thể hành động được. Mỗi ngăn xếp mã hóa một tư thế nhận thức riêng biệt - một tư thế xác định kiến thức được cấu trúc như thế nào, dữ liệu nào được coi là có liên quan và hình thức không chắc chắn nào được cho phép hoặc loại trừ trước.
Ví dụ, LLM độc quyền thường được đào tạo trên kho dữ liệu rộng lớn nhưng không rõ ràng: các chủ đề Reddit, nội dung web bị thu thập, thỏa thuận cấp phép không được tiết lộ. Chúng thường được tối ưu hóa cho quy mô, sự trôi chảy và cách ly pháp lý hơn là độ trung thực theo ngữ cảnh. Những mô hình này rất giòn với sắc thái địa phương, đấu tranh với các phương ngữ ít được đại diện và có xu hướng mã hóa logic văn hóa thống trị ngay cả khi chúng tuyên bố tính phổ quát. Ngược lại, các mô hình ngôn ngữ địa phương hóa mới nổi - chẳng hạn như những người được đào tạo ở Việt Nam, Indonesia hoặc UAE - thường hoạt động với kho lưu trữ văn hóa cụ thể: kho lưu trữ nhà nước, phương tiện truyền thông bản địa, lời nói có chú thích từ các dân tộc thiểu số ngôn ngữ. Các thông số của chúng có thể nhỏ hơn, nhưng khung nhận thức của chúng chặt chẽ hơn. Họ không chỉ kém quyền lực hơn; chúng được hiệu chỉnh khác nhau.
Đây không chỉ đơn giản là một câu hỏi về sự thiên vị hoặc hòa nhập. Đó là một vấn đề cấu trúc: những loại câu hỏi nào mà một mô hình được thiết kế để trả lời, những gì được coi là đầu vào hợp lệ và nhận thức luận của nó có thể đọc được trong kiến trúc của nó. Chúng ta có thể nghĩ về mỗi ngăn xếp như cung cấp các khả năng nhận thức khác nhau - một thuật ngữ vay mượn từ thiết kế để mô tả phạm vi hành động mà một hệ thống cho phép hoặc ức chế. Một số ngăn xếp được xây dựng để dự đoán sở thích của người tiêu dùng hoặc tự động hóa việc tạo nội dung; những người khác được điều chỉnh để hỗ trợ các nhiệm vụ quản trị, dịch thuật hoặc giáo dục trong môi trường đa dạng về ngôn ngữ. Những gì bị loại trừ - đa nghĩa, biến thể phương ngữ, sự mờ đục lịch sử - cũng quan trọng như những gì được mã hóa, bởi vì những lựa chọn này xác định thế giới của ai trở nên dễ đọc đối với máy móc - và mở rộng, có thể truy xuất được đối với con người tương lai thông qua chúng - và ai bị gửi vào sự tối tăm.
Quản trị ngăn xếp cũng phản ánh những rạn nứt nhận thức này. Các ngăn xếp độc quyền có xu hướng bị che khuất: trọng số của chúng bị đóng, quy trình ra quyết định của chúng bị chôn vùi đằng sau API và tuyên bố từ chối trách nhiệm về quyền riêng tư. Chúng tạo ra tính dễ đọc cho người dùng cuối trong khi khiến các cơ quan quản lý và công chúng không thể đọc được. Ngược lại, các ngăn xếp trọng lượng mở hoặc bán mở có thể phân mảnh lĩnh vực: cho phép các tác nhân địa phương phân nhánh, tinh chỉnh hoặc triển khai lại các mô hình theo những cách làm tăng tính không đồng nhất - và cùng với đó, chủ nghĩa đa nguyên nhận thức. Nhưng chủ nghĩa đa nguyên này phải trả giá bằng tính nhất quán, khả năng tương tác và trong một số trường hợp, giám sát an toàn tập trung - những rủi ro có thể khiến hệ thống không ổn định, tạo ra ma sát xuyên biên giới và mở ra khoảng cách quản trị chính xác ở những nơi cần sự liên kết nhất.
"Chuyển động xếp thứ ba, về cơ bản, là một cuộc cạnh tranh xem ai sẽ viết kịch bản lớp tiếp theo của sự hiểu biết của thế giới."
Kết quả không phải là một thế giới AI duy nhất, mà là các cơ sở hạ tầng nhận thức chồng chéo, mỗi cơ sở hạ tầng tạo ra sự thật, loại trừ và hình thức trừu tượng riêng. Đây là điều làm cho các ứng biến cơ sở hạ tầng của Việt Nam trở nên quan trọng: chúng phản ánh không chỉ một hàng rào địa chính trị. Thay vào đó, chúng cung cấp một cái nhìn thoáng qua về chính trị mới nổi của thiết kế nhận thức - nơi xây dựng một ngăn xếp có nghĩa là quyết định không chỉ cách thức hoạt động của trí thông minh, mà còn quyết định thế giới của ai.
Ví dụ, PhoGPT của Việt Nam, một mô hình mã nguồn mở tham số 4B, được đào tạo từ đầu trên kho dữ liệu Việt Nam trị giá 102 tỷ token - bao gồm tin tức được thu thập dữ liệu trên web, văn bản pháp lý, sách, Wikipedia, tạp chí y khoa và hơn thế nữa - dẫn đến một mô hình phù hợp với cụm từ, quản trị và chuẩn mực ngôn ngữ của Việt Nam thay vì các thành ngữ tiếng Anh tập trung vào Reddit. Ngược lại, các mô hình của Hoa Kỳ như GPT-4 của OpenAI được đào tạo trên kho dữ liệu tiếng Anh khổng lồ được thu thập từ các nguồn như Reddit, Wikipedia và các nhà xuất bản được cấp phép, tối ưu hóa chúng để lưu loát tiếng Anh toàn cầu nhưng để chúng trở nên giòn vã với sắc thái địa phương và phương ngữ ít được đại diện. Trong khi đó, Ernie Bot của Baidu chuyển hướng các truy vấn trên Quảng trường Thiên An Môn sang các bản tóm tắt lịch sử được nhà nước phê duyệt, phản ánh cách ngăn xếp của nó được hiệu chỉnh theo các kiểm soát thông tin của nhà nước Trung Quốc. Những phân kỳ này cho thấy cách các ngăn xếp khác nhau quyết định thế giới nào trở nên dễ đọc đối với máy móc và thế giới nào bị xóa.
Sự trỗi dậy của các đại lý
Sự bất hòa này trở nên gay gắt hơn với sự gia tăng của các tác nhân AI - các mô hình không chỉ trả lời lời nhắc mà còn theo đuổi mục tiêu, đưa ra quyết định và tương tác với môi trường kỹ thuật số hoặc vật lý thay mặt cho người dùng. Khi các tác nhân này chuyển từ các bản demo trong phòng thí nghiệm sang quy trình làm việc trong thế giới thực - điều phối các nhiệm vụ, điều hướng giao diện, hành động tự động - các cổ phần nhận thức của thiết kế ngăn xếp ngày càng sâu sắc.
Một đại lý được đào tạo trên một ngăn xếp độc quyền của Hoa Kỳ có thể đảm nhận cơ quan cá nhân, mặc định sử dụng tài liệu bằng tiếng Anh hoặc ưu tiên hiệu quả hơn đàm phán. Ngược lại, một tác nhân được xây dựng trên mô hình Việt Nam hoặc Indonesia bản địa hóa có thể được nhúng với các ưu tiên khác nhau - phù hợp với sự phối hợp tập thể, hệ thống phân cấp không chính thức hoặc các ràng buộc nhạy cảm với ngữ cảnh. Đây không chỉ là những điều kỳ quặc về hành vi. Chúng là các kịch bản nhận thức - các giả định được mã hóa về thế giới là gì, nó hoạt động như thế nào và hành động bên trong nó sẽ diễn ra như thế nào.
Cuộc cạnh tranh về các tập lệnh tác nhân này đã diễn ra ở Trung Quốc, nơi sự phát triển của các tác nhân AI địa phương đang tăng tốc với tốc độ. Ở phương Tây, sự chú ý đã chuyển sang tính linh hoạt trong cuộc trò chuyện của GPT-4o - và gần đây hơn là các tuyên bố đánh bại điểm chuẩn của GPT-5 - nhưng các công ty Trung Quốc như Butterfly Effect, Alibaba, Zhipu và ByteDance đang xây dựng các hệ thống vượt qua hoàn toàn trò chuyện. Các tác nhân này thực hiện, thay vì chỉ phản hồi. Được thiết kế để cuối cùng tương tác trên các hệ sinh thái ứng dụng được tích hợp chặt chẽ, chúng thực hiện các tác vụ, xử lý biểu mẫu và phối hợp giữa các dịch vụ với đầu vào của người dùng tối thiểu. Giao diện ưu tiên thiết bị di động, không ma sát và định hướng xung quanh hành động hơn là đối thoại.
Sự khác biệt này là cơ sở hạ tầng chứ không chỉ đơn thuần là chức năng. Các tác nhân này được đào tạo về các chế độ dữ liệu trong nước, được nhúng trong các hệ thống quản trị và được hiệu chỉnh theo các chuẩn mực hành vi khác biệt so với các giả định thiết kế của các ngăn xếp do Hoa Kỳ dẫn đầu. Trong mô hình Trung Quốc, tác nhân không phải là một đồng nghiệp tổng hợp hoặc người bạn đồng hành biểu cảm. Nó là một nút hoạt động: một trung gian thủ tục trong một ngăn xếp nền tảng, nơi thương mại, truyền thông và quản trị bị mờ.
Đặc vụ trong thế giới thực
Một vài lưu ý về sự sẵn sàng và khả năng chống chịu của các tác nhân AI là theo thứ tự. Để hiểu cách các tác nhân có thể hiện thực hóa trong thực tế, trước tiên chúng ta phải hiểu kết cấu của quy trình làm việc mà họ phải sống - và địa hình không bằng phẳng của cơ sở hạ tầng kỹ thuật số, việc tiếp nhận đám mây và tiêu chuẩn hóa quy trình định hình sự tích hợp của chúng. Các tác nhân AI đã trở thành đối tượng mong muốn mới trong cả trí tưởng tượng kỹ thuật và thương mại. Họ chủ động, phối hợp giữa các hệ thống và hứa hẹn sự thay đổi từ các công cụ phản ứng sang cộng tác viên hướng đến mục tiêu. Tuy nhiên, sự thay đổi này mang lại sự bất hòa của riêng nó - đặc biệt là khi các đại lý bắt đầu đi qua quy trình làm việc trong thế giới thực.
Một căng thẳng song song xuất hiện trong giới doanh nghiệp phương Tây. Trong thế giới cổ phần tư nhân, các đại lý được nói đến với sự khẩn cấp ("Phải triển khai trên toàn danh mục đầu tư") hoặc với sự hoài nghi ("Không có ROI có thể đo lường được"). Nhưng cả hai quan điểm đều làm phẳng sự thật thứ ba: Hầu hết các công ty đều không chuẩn bị về mặt cấu trúc. Các tác nhân chạy liên tục, tương tác trên các hệ thống tách biệt và đưa ra quyết định tự động yêu cầu nâng cấp cơ bản — API ổn định, dữ liệu có thể tương tác, quy trình làm việc được ánh xạ tốt. Nếu không có chất nền này, quyền tự chủ trở thành một trách nhiệm. Hệ thống bị vênh, nguồn gốc biến mất, phi công chết máy.
Như nhà khoa học máy tính Arvind Narayanan quan sát, các nhà công nghệ thường nhầm lẫn giữa kháng cự với sự không sẵn sàng. Nếu thế giới không áp dụng các tác nhân trên quy mô lớn, đó không phải là vì thiếu tầm nhìn mà vì hầu hết các cơ sở hạ tầng không bao giờ được thiết kế để hỗ trợ tính toán liên tục, tự khởi tạo. Và hơn thế nữa: Hầu hết các công việc, giống như hầu hết các hệ thống, không thể rút gọn thành các nhiệm vụ rời rạc. Động lực khó tự động hóa nhất thường chính xác là những động lực trốn tránh chính thức hóa - ở rìa của hướng dẫn, vượt qua ranh giới ngầm.
"Những ứng biến cơ sở hạ tầng của Việt Nam... cung cấp một cái nhìn thoáng qua về chính trị mới nổi của thiết kế nhận thức - nơi xây dựng một ngăn xếp có nghĩa là quyết định không chỉ cách thức hoạt động của trí thông minh, mà còn quyết định thế giới của ai.
Đây là nơi thiết kế ngăn xếp trở lại. Một đại lý Việt Nam hoặc Indonesia, được đào tạo về quy trình làm việc địa phương, có thể mã hóa các giả định nhận thức khác nhau - đồng thuận không chính thức về ủy quyền rõ ràng, lý luận chấp nhận sự mơ hồ hơn logic chặt chẽ. Những khác biệt này không phải là lỗi mà là sự thích nghi với thực tế cơ sở hạ tầng. Theo nghĩa này, các tác nhân không liên kết không chỉ là các lựa chọn thay thế, mà còn là các hiện vật của ràng buộc định vị, được thiết kế để hoạt động trong các hệ thống có thể đọc được cục bộ.
Do đó, nhiệm vụ không phải là bắt chước mô hình tác nhân của Thung lũng Silicon, mà là kịch bản đại lý từ dưới lên - trên các kiến trúc có thể mang nó và bằng các ngôn ngữ mà các hệ thống địa phương có thể hiểu được. Cho đến lúc đó, mọi tuyên bố về ủy quyền thông minh đều có nguy cơ tạo ra nhiều sự mờ mịt hơn là quyền tự chủ.
Nếu các mô hình mã hóa kiến thức, các tác nhân thực thi nó. Họ trở thành sứ giả của ngăn xếp đã sinh ra họ. Câu hỏi không chỉ là mô hình nào được xây dựng, mà còn là tác nhân nào được triển khai - và theo hình ảnh của ai. Trong ánh sáng này, ngăn xếp thứ ba của Việt Nam không chỉ là một hàng rào chống lại sự phụ thuộc vào nền tảng: đó là một cuộc diễn tập cho một tương lai trong đó các tác nhân AI – được đào tạo tại địa phương, được quản lý theo mô-đun – ban hành một thế giới quan không được xác định bởi Thung lũng Silicon hoặc Bắc Kinh, mà bởi logic chi tiết, có vị trí của một hệ sinh thái kỹ thuật số có chủ quyền.
Chủ quyền thành từng mảnh
Có một câu hỏi tốt hơn là Việt Nam sẽ chọn khối nào: đó là ai quyết định sự liên kết có thể trông như thế nào? Hầu hết các quốc gia sẽ không xây dựng một ngăn xếp AI từ đầu; Họ sẽ áp dụng, thích nghi và lai tạo - lắp ráp trí thông minh từ các thành phần không hoàn toàn của riêng họ. Là một bricoleur cơ sở hạ tầng, làm như vậy kết nối lại với nhau một ngăn xếp không thuộc về bá chủ nào. Trong không gian giữa sự phụ thuộc vào hộp đen và sự từ chối cơ sở hạ tầng, một chủ quyền mới đang hình thành - một trọng lượng, một kho dữ liệu, một ngã ba tại một thời điểm. Ngăn xếp thứ ba không phải là sự tò mò địa phương; đó là một bản xem trước về bao nhiêu thế giới sẽ được xây dựng.
Tương lai của AI sẽ không được vẽ bằng các khẩu hiệu tăng tốc hoặc sơ đồ xếp lớp gọn gàng. Nó sẽ nổi lên - lộn xộn, không đồng đều, chiến thuật - từ sự xích mích của sự thích nghi và lao động kiên nhẫn để dụ dỗ các hệ thống khác nhau vào đối thoại. Đọc địa hình này là điều khiển giữa cường điệu và tuyệt vọng, điều chỉnh nhịp đập của sự liên kết: nối mã thành cáp, tầm nhìn bẻ cong thành bản địa, chủ quyền được lắp ráp dần dần. Giống như một tín hiệu được định tuyến qua các rơ le đi lạc, kiến trúc sắp tới sẽ phát sáng với những đường vòng hiếm khi xuất hiện trên các tiêu đề nhưng lại lặng lẽ vẽ lại bản đồ.
Đặng Nguyễn - Theo NoemaMag