Mặc dù hiện nay vẫn đang trong quá trình phát triển, nhưng AI cũng đã góp mặt trong rất nhiều ngành, nhiều lĩnh vực khác nhau của đời sống, từ kinh tế, xã hội cho đến quân sự, quốc phòng và đã thể hiện những tác động tích cực tới hiệu suất công việc. Tuy nhiên, điểm mấu chốt của hệ thống AI là dữ liệu càng nhiều, liên tục, thông tin càng chính xác thì các dự đoán, hỗ trợ từ AI càng có tính chính xác cao, đưa ra các phương án tối ưu để người dùng lựa chọn. Do vậy, trong cuộc “chạy đua” để nghiên cứu, xây dựng, phát triển và sở hữu công nghệ AI giữa Mỹ và Trung Quốc có thể thấy giai đoạn hiện nay giống như một “cuộc chiến” về thu thập dữ liệu.
Vụ tấn công hệ thống máy chủ Microsoft Exchange
Tháng 01/2021, từ việc tình cờ quan sát được một hành vi tải email bất hợp pháp trong hệ thống Microsoft Exchange, phần mềm hỗ trợ doanh nghiệp quản lý email, lịch, danh bạ hiện đang được hàng chục nghìn doanh nghiệp trên khắp thế giới sử dụng. Steve Adair, người sáng lập công ty an ninh mạng Volexity – một công ty chuyên về phát hiện lỗ hổng bảo mật đã tiến hành truy vết dựa trên những thông tin được yêu cầu và nhận thấy các thông tin này được gửi đến từ một máy chủ ảo nằm ngoài hệ thống của Microsoft Exchange. Phát hiện này đã khám phá ra một vụ đánh cắp thông tin với quy mô lớn khi mà suốt gần ba tháng, những kẻ đột nhập đã tự do tiếp cận tất cả mọi thứ từ email tới lịch làm việc, danh bạ và ngang nhiên quét dữ liệu của hàng chục ngàn nạn nhân không đề phòng. Những nạn nhân này bao gồm các cửa hàng gia đình, phòng khám răng, các khu học chính, các cơ quan công quyền của Mỹ – tất cả đều hướng đến mục đích là thu thập thông tin.
Theo như miêu tả của Adair thì quy trình của cuộc tấn công này được thực hiện như sau: Ở giai đoạn một, ngay khi tin tặc khóa được mục tiêu và đột nhập được vào các máy chủ Exchange có bảo mật yếu, chúng đã đặt mã nhằm đánh lừa máy chủ trong việc yêu cầu thông tin như các email, tài liệu, tệp tin PDF. Lúc này, các máy chủ nhận trong hệ thống đều xác thực yêu cầu đó là hợp pháp. Hành động này giống như một sự giả mạo máy chủ Exchange, khiến cho các máy chủ nhận đều cho rằng yêu cầu truy cập thông tin đến từ một thực thể đáng tin cậy và không nhận ra đó là một yêu cầu hoàn toàn không được xác thực.
Về mặt kỹ thuật, để tấn công vào các hệ thống yếu của một công ty thì chỉ cần thỏa mãn hai điều kiện đó là được kết nối với internet và được kiểm soát nội bộ bởi bộ phận quản lý dữ liệu tại chỗ của công ty đó. Hiện nay, mặc dù hầu hết các công ty đều chủ yếu sử dụng phần mềm Exchange trên nền tảng đám mây, nhưng một số ngân hàng, các tập đoàn lớn và các cơ quan quân sự quốc phòng vẫn thường duy trì một hệ thống kép. Qua đó, họ sử dụng việc lưu trữ dữ liệu trên đám mây cho các hoạt động hàng ngày, song vẫn duy trì các máy chủ nội bộ để lưu trữ các thông tin độc quyền mà họ muốn tự kiểm soát. Ngoài ra, những doanh nghiệp vừa và nhỏ cũng thường sử dụng máy chủ Exchange riêng và phân công một bộ phận IT nhỏ đảm nhiệm điều hành. Điều này dẫn đến những nguy cơ về một cuộc tấn công như đã thấy, vì một khi máy chủ email của các công ty này được kết nối với Internet, điều đó có nghĩa là bất kỳ kẻ xấu nào cũng có khả năng tấn công.
Trong vụ tấn công vào Microsoft Exchange, các tin tặc đã đột nhập được vào hệ thống máy chủ bằng cách lợi dụng một số mã lỗi, rồi chiếm quyền điều khiển. Các lỗ hổng nghiêm trọng này, được gọi chung là ProxyLogon, ảnh hưởng đến Exchange Server 2013, Exchange Server 2016 và Exchange Server 2019. Tuy nhiên, Exchange Online lại không chịu tác động bởi nó chạy trên nền tảng đám mây – nền tảng có sự bảo vệ tốt hơn. Các chuyên gia an ninh mạng của Microsoft đã định danh các lỗi cụ thể như sau:
- CVE-2021-26855: lỗ hổng giả mạo yêu cầu phía máy chủ (SSRF) cho phép kẻ tấn công gửi các yêu cầu HTTP tùy ý và xác thực là máy chủ Exchange
- CVE-2021-26857: Lỗ hổng trong dịch vụ Unified Messaging, cho phép kẻ tấn công thực thi mã tùy ý
- CVE-2021-26858: Lỗ hổng ghi file trong Exchange, kẻ tấn công có thể tùy ý ghi vào bất kỳ đường dẫn nào trên máy chủ.
- CVE-2021-27065: Lỗ hổng ghi file trong Exchange, kẻ tấn công có thể tùy ý ghi vào bất kỳ đường dẫn nào trên máy chủ.
Hé lộ những vấn đề bất thường
Trước khi nhận ra những điểm bất thường trong vụ tấn công, các chuyên gia về an ninh mạng của Microsoft đánh giá vụ tấn công lần này cũng giống như các vụ tấn công khác vẫn thường xuyên diễn ra trên không gian mạng. Họ cũng không mất quá nhiều thời gian để xác định được thủ phạm đang chuyển dữ liệu trong các máy chủ của Exchange là nhóm tin tặc APT có kỹ năng cao và tinh vi có nguồn gốc từ Trung Quốc với tên gọi là Hafnium. Đây là nhóm tin tặc có xu hướng tiếp cận mục tiêu là thông tin của các cơ quan chính phủ, các công ty trong lĩnh vực y tế và các trường đại học. Chúng thường tìm mục tiêu bằng việc quét mạng internet để tìm kiếm các hệ thống chưa được nâng cấp hoặc vá lỗi. Trong vụ tấn công này, các chuyên gia an ninh mạng tin rằng nhóm tin tặc này đã tìm kiếm trên internet các công ty sử dụng Exchange nội bộ.
Cuộc tấn công sẽ không có gì đáng nói cho đến khi các chuyên gia nhận thấy dường như những kẻ tấn công này có sẵn trong tay một phần dữ liệu cụ thể nào đó để khai thác như: địa chỉ email chính xác của những người điều hành máy chủ Exchange trên toàn thế giới. Điều này khiến họ cảm thấy khá bất thường, bởi vì về mặt kỹ thuật thì các địa chỉ email này là những thông tin riêng của mỗi công ty hay tổ chức. Và tiếp theo đó là tốc độ lan rộng cũng như tầm ảnh hưởng của cuộc tấn công đã buộc các chuyên gia an ninh mạng của Microsoft phải khẩn trương đưa ra các bản vá lỗi ngay lập tức. Cuộc tấn công cũng thu hút sự quan tâm mạnh của chính giới Mỹ. Phát biểu với giới báo chí về vụ việc này, Jen Psaki, thư ký báo chí của Nhà Trắng nói “Mối đe dọa này đã thực sự hiện hữu. Bất cứ ai đang sử dụng các máy chủ này – từ chính phủ tới các cơ sở tư nhân, giới học thuật – cần phải hành động ngay lúc này để sửa lại.”
Phát biểu sau đó, Kawaguchi, Giám đốc an ninh thông tin của Microsoft 365 cho biết, “Đây chắc hẳn là lần đầu tiên một sản phẩm chúng tôi xây dựng được nhắc tới cụ thể trong một buổi thông cáo báo chí của Nhà Trắng. Vụ việc lần này có nhiều khía cạnh và chiến dịch phản ứng lần này này cũng khá mới lạ”.
Kawaguchi nói, trong suốt gần 20 năm làm việc tại Microsoft, ông chưa bao giờ thấy một cuộc tấn công nào có quy mô nhanh như vậy. Và sự lan rộng của nó hoàn toàn không bình thường vì các tin tặc quốc gia thường có xu hướng nhắm tới những mục tiêu rõ ràng, chúng biết mục tiêu chúng muốn và thu thập một cách âm thầm. Trong sự việc lần này, tin tặc đang hành động như thể là không quan tâm tới việc ai hay cái gì có thể bị cuốn vào cuộc tấn công của chúng, mà chỉ tập trung đến việc thu thập dữ liệu. Ông cũng cho biết thêm, trong một không gian kết nối như hiện nay, bất kỳ cá nhân hay tổ chức nào cũng đều có thể trở thành nạn nhân của các cuộc tấn công, không có ai là ngoại lệ.
Nhìn nhận từ vụ tấn công Microsoft Exchange, các chuyên gia an ninh mạng của Mỹ đặt ra vấn đề về việc có khả năng tin tặc đã tận dụng được những thông tin thu thập được từ các vụ tấn công khác trước đó. Và cuộc tấn công vào hệ thống phần mềm Microsoft Exchange cũng chỉ là một phần nhỏ trong một kế hoạch to lớn hơn nhiều. Đó là tham vọng xây dựng một cơ sở dữ liệu lớn nhằm mục đích phát triển trí tuệ nhân tạo của Trung Quốc.
Tham vọng và chiến lược
Trở lại năm 2017, Trung Quốc vào thời điểm đó đã coi trí tuệ nhân tạo là một lĩnh vực nghiên cứu quan trọng về mặt chiến lược và xác định sẽ đưa việc phát triển trí tuệ nhân tạo tầm cỡ thế giới trở thành ưu tiên quốc gia – giống như cuộc chạy đua lên mặt trăng của người Mỹ. Để làm được điều đó Trung Quốc cần tập trung vào hai vấn đề: Đào tạo và phát triển các chuyên gia về khoa học máy tính mà có thể viết thuật toán, và thu thập thông tin mà các thuật toán đẳng cấp thế giới cần học hỏi.
Đây cũng là năm mà các học giả Trung Quốc viết nghiên cứu về trí tuệ nhân tạo nhiều hơn bất cứ quốc gia nào trên thế giới. Xét về tổng số bài báo khoa học liên quan đến AI, hiện tại Trung Quốc đã vươn lên vị trí hàng đầu. Thống kê từ năm 2012 cho đến năm 2021, các nhà khoa học Trung Quốc đã công bố 240.000 công trình khoa học trong lĩnh vực này, trong khi các nhà khoa học Mỹ chỉ công bố 150.000 công trình. Về số lượng các công ty hoạt động trong lĩnh vực trí tuệ nhân tạo, Trung Quốc có hơn 1000 công ty, vẫn đứng thứ hai sau Mỹ. Tuy nhiên, các đại học của Trung Quốc hiện đang đào tạo ngành khoa học máy tính với tốc độ chóng mặt.
Cũng trong năm 2017, Trung Quốc đã công bố “Kế hoạch Phát triển trí tuệ nhân tạo thế hệ tiếp theo đến năm 2030”. Theo kế hoạch đó thì Trung Quốc cần phải tập trung phát triển các sản phẩm thông minh như ô tô thông minh, robot thông minh và máy bay không người lái, hệ thống nhận dạng giọng nói, thiết bị y tế về chẩn đoán hình ảnh.
Hiện nay, Trung Quốc đã đạt được thành công không chỉ trong lĩnh vực nghiên cứu lý thuyết trí tuệ nhân tạo, mà còn cả những ứng dụng thiết thực của AI trong cuộc sống. Công nghệ này đang trở thành cơ chế mà trong đó việc quản lý hạ tầng giao thông được nâng cấp, tỷ lệ bảo hiểm được tính toán, tín dụng được phê duyệt, các khoản thế chấp được chấp thuận và dữ liệu chăm sóc sức khỏe được cải thiện. Cụ thể, kể từ năm 2016, hệ thống City Brain của Alibaba ra đời giúp giám sát các phương tiện giao thông tại thành phố Hàng Châu của Trung Quốc. Kết quả của việc áp dụng hệ thống “thông minh” đã giúp giảm thiểu tỷ lệ ùn tắc. Tiếp sau đó, nhiều thành phố của Trung Quốc bắt đầu sử dụng những “cảm biến thông minh” và thuật toán AI để tối ưu hóa nền kinh tế đô thị của họ. Thông qua việc sử dụng hệ thống phân tích video từ camera nhận diện khuôn mặt cũng như các cảm biến khác nhau, bao gồm cả thiết bị Internet vạn vật (IoT) lấy dữ liệu ở xa về mức tiêu thụ năng lượng, các cơ quan chức năng của Trung Quốc có thể giám sát việc tuân thủ các biện pháp phòng chống dịch trên địa bàn. Các thuật toán AI của Trung Quốc cũng đã giúp phân tích lượng dữ liệu khổng lồ để thiết lập một hệ thống toàn quốc về “mã sức khỏe” số.
Một lợi thế cạnh tranh lớn trong cuộc chạy đua thông tin khiến Trung Quốc phát triển mạnh về AI là nguồn dữ liệu dồi dào mà nước này tạo ra. Với hơn 1 tỷ dân, Trung Quốc hiện đang có một cơ sở dữ liệu khổng lồ. Người đứng đầu Sinovation Ventures và cựu Chủ tịch Google Trung Quốc Kai-Fu Lee đã nhấn mạnh rằng dữ liệu là dầu mỏ của thế kỷ XXI. Quốc gia nào thu thập nhiều dữ liệu hơn cuối cùng sẽ chiếm vị trí hàng đầu trong lĩnh vực AI.
Thêm vào đó, sự tiến bộ trong lĩnh vực AI phụ thuộc vào số lượng và chất lượng dữ liệu mà theo giới phân tích của Mỹ thì Trung Quốc hiện vẫn đang tiếp tục bổ sung vào kho dữ liệu của mình những thông tin lấy được từ các vụ đánh cắp dữ liệu quy mô lớn. Giới phân tích của Mỹ tin rằng Trung Quốc thu thập các thông tin này để xây dựng một “bức tranh” ghép thông tin từ đó xây dựng một cơ sở dữ liệu trí tuệ nhân tạo đẳng cấp thế giới. Điều này giải thích xu hướng của tin tặc Trung Quốc trong các vụ tấn công, đó là "thu thập và tổng hợp dữ liệu càng nhiều càng tốt và không phân biệt dữ liệu đó đến từ đâu".
Mặc dù, hiện tại Mỹ vẫn duy trì vị trí hàng đầu trong các nghiên cứu cơ bản. Ví dụ, các nền tảng mã nguồn mở cho học máy mà các nhà phát triển khắp thế giới đang sử dụng đều được sản xuất bởi các công ty Mỹ như Google, Facebook và những công ty khác. Các chip cần thiết để thực hiện những phép tính phức tạp cũng được các công ty Mỹ phát triển. Tuy nhiên, theo báo cáo của Ủy ban An ninh quốc gia Mỹ về trí tuệ nhân tạo thì hiện nay Mỹ cần đầu tư nhiều hơn nữa vào phát triển công nghệ trí tuệ nhân tạo và tiếp tục chính sách hạn chế cung cấp thiết bị để sản xuất chip thế hệ mới nhất và giám sát cẩn thận việc cung cấp các công nghệ cao khác cho Trung Quốc, vì ở góc độ quân sự thì AI hoàn toàn có thể sẽ trở thành vũ khí ưu tiên hàng đầu trong các cuộc xung đột tương lai.