Tình báo truyền thông xã hội và xử lý dữ liệu lớn

08:25 | 13/07/2017

Truyền thông xã hội (Social Media) là thuật ngữ để chỉ một cách truyền thông kiểu mới trên nền tảng (platform) các dịch vụ trực tuyến. Truyền thông xã hội đang được sử dụng để thu thập thông tin tình báo, tuyên truyền, truyền bá thông tin, cũng như tuyển mộ lực lượng... Tầm quan trọng và vai trò của các nền tảng này trong tác chiến quốc tế đang gia tăng khi giới quân sự các nước đua tranh khai thác các công nghệ mới nổi, và vì vậy, vấn đề xử lý thông tin dữ liệu lớn (big data), vấn đề lọc những dữ liệu hữu ích trong vô số những khối dữ liệu khổng lồ là rất quan trọng.

Sự nổi lên của truyền thông xã hội
 
Sự nổi lên của tác chiến điều khiển học đã làm thay đổi bản chất của các cuộc xung đột, đưa thêm môi trường ảo vào chiến trường truyền thống. Các năng lực của môi trường ảo được tạo ra nhờ các máy chủ, hệ thống máy tính, chương trình phần mềm,  năng lực truyền dữ liệu tốc độ cao… đang làm xuất hiện sự kết nối giữa các lĩnh vực điều khiển học và vật chất trong các cuộc xung đột.

Đặc biệt, trong 5 năm qua, tầm quan trọng của tình báo truyền thông xã hội (SOCMINT) đã tăng lên nhanh chóng và tác động mạnh tới các lĩnh vực khác. Vì lẽ, số người sử dụng truyền thông xã hội đã gia tăng đáng kể, chẳng hạn tại Mỹ, chiếm tới 65% số người trưởng thành, tức là nhiều gấp gần 10 lần so với thập kỷ trước. Điều đó phản ánh sự gia tăng các nền tảng truyền thông xã hội trên toàn cầu.

Ngày nay, số lượng mạng xã hội đang không ngừng gia tăng, lên tới hàng chục ngàn mạng, bao gồm một số mạng chuyên dùng (chẳng hạn để tạo trò chơi), mạng để trao đổi ý kiến microblog (như Twitter), mạng trên cơ sở tương tác bạn bè (như Facebook), các mạng để chia sẻ văn bản, tin nhắn....

Các nền tảng truyền thông xã hội đa dạng này thường tạo cơ hội cho hoạt động mang tính cộng tác. Đang tồn tại các nhóm chia sẻ công việc và kiến thức (Keynote, Prezi, Slideshare) hoặc văn kiện (DropBox, Google Docs, SharePoint), kết nối và cập nhật bè bạn, gia đình và đồng nghiệp (Facebook, LinkedIn, VKontakt, RenRen), truyền đạt thông tin và tin nhắn nóng (Skype, Snapchat, WhatsApp), theo dõi vị trí của các nhóm xã hội khác (FindMyFriends, Foursquare, Google+, Localmind), tạo hội thoại nóng (Whisper, ShapR), lập lớp học ảo và môi trường học tập (Blackboard, Hangouts, Moodle), microblog (Jaiku, Tumblr, Twitter, Sina Weibo), và truyền tin theo thời gian thực qua ảnh và video (Instagram, Periscope, Vine, YouTube). Ngoài ra, chúng còn được sử dụng để phát tán, tuyên truyền  và tương tác về thái độ và tư tưởng với phạm vi người dùng rộng rãi.

Tuy nhiên, đã có cảnh báo rằng các cơ hội do công nghệ thông tin tạo ra đang cho phép bất kỳ ai cũng có thể lưu trữ, biên tập và chia sẻ thông tin, hình ảnh và video tức thời, dù các phương tiện truyền thông truyền thống có đưa tin về các sự kiện đó hay không. Điều đó giúp mỗi cá nhân đều có cơ hội trở thành người tạo ra thông tin và gửi tới người dùng khác với số lượng và kích cỡ  không giới hạn trên phạm vi thế giới. Chính những nền tảng ấy đã giúp các tổ chức, cá nhân tuyển mộ lực lượng và đạt được những tác động chính trị và quân sự mang tính chiến lược.

Với tư cách một bộ phận của không gian điều khiển học, truyền thông xã hội đang tạo thêm các lớp thách thức mới về cảm nhận, tâm lý và nhận thức đối với từng môi trường tác chiến. Theo NATO, truyền thông xã hội thường được coi là một bộ phận của không gian điều khiển học, tuy nhiên, khó có thể phân định khi nói đến truyền thông xã hội với tư cách một nền tảng (công cụ hay hệ thống) để truyền đạt thông tin, hay là nơi đã tạo ra nguồn tin (nội dung thông tin).



Truyền thông xã hội và tác chiến lai

Trong truyền thông xã hội, xuất hiện thuật ngữ “chiến tranh lai” hay “tác chiến lai”. Khái niệm “lai” ở đây được hiểu là tiến hành loại hình chiến tranh mang tính lai ghép giữa tác chiến quân sự truyền thống với tác chiến dựa trên không gian mạng, cụ thể là dựa trên mạng xã hội. Trong bối cảnh đó, truyền thông xã hội được “vũ khí hóa” và trở thành một bộ phận hợp thành của tác chiến lai. Khi đó, truyền thông xã hội được sử dụng trong tấn công điều khiển học và được coi là một phương tiện “cộng hưởng” sức mạnh của lực lượng phi truyền thống. Một khi truyền thông xã hội được khai thác trong loại hình tác chiến này thì các phương thức như xâm nhập mạng, từ chối thông tin, đánh lừa và thông tin giả kết nối điện tử trở thành những chiến thuật mạnh. Theo một quan điểm từ Đan Mạch, khi đó chiến tranh không chỉ là chuyện đối địch giữa các quốc gia mà còn có nghĩa là phải nhận dạng về phương thức truyền thông mạng xã hội được sử dụng cho quân sự. Những hoạt động quân sự này không chỉ giới hạn ở thu thập tình báo, xác định mục tiêu, tác chiến tâm lý, mà cả trong tấn công và phòng thủ điều khiển học, cũng như các hoạt động chỉ huy và điều khiển.

Để làm điều đó, phải hiểu rõ bản chất của mối đe dọa an ninh điều khiển học hiện đại. Ngày nay không gian điều khiển học về cơ bản đã trở thành một trận tuyến, với sự hoạt động của các dạng thức tác chiến phi đối xứng. Nó cho phép truy cập từ các mạng thông thường đến các mạng chỉ huy và điều khiển và vào các cơ sở hạ tầng thiết yếu.

Trên toàn cầu, các mạng truyền thông xã hội đang được hàng loạt băng nhóm sử dụng trên bình diện chiến lược. Các đối thủ, cả quốc gia lẫn phi quốc gia đều khai thác cách tiếp cận lai để theo đuổi mục tiêu chính trị và quân sự, tức là, kết hợp tác chiến quân sự với tấn công điều khiển học, gây áp lực ngoại giao và/hoặc kinh tế, tạo ra các chiến dịch thông tin (tuyên truyền). Các xung đột diễn ra tại Afghanistan, Crimea, Iraq, Libya, Syria và Đông Ukraina đang phản ánh việc sử dụng truyền thông xã hội để thu thập tình báo, nhắn tin tuyên truyền, phân phối thông tin giả, điều động người ủng hộ, nhận dạng các mục tiêu cơ động phân tán, hoặc tác động tới thái độ của những người dùng đang tương tác, trong bối cảnh truyền thông xã hội vẫn đang là một diễn đàn toàn cầu quan trọng cho các tranh cãi không hề qua kiểm chứng.

Dường như khác với cách truyền đạt thông tin giữa những con người, trong các mạng xã hội và truyền thông xã hội, người ta có thể tác nghiệp nặc danh. Hoặc người ta có thể trở thành một ai đó khác. Và vì thế, nhiều cuộc chiến hiện đại là cuộc chiến nhằm giành dư luận công chúng. 

Tác chiến truyền thông xã hội và tình báo mạng xã hội  

Tác chiến truyền thông xã hội có ba vai trò quan trọng. Trước hết, đó là tổ chức các trào lưu đe dọa phi đối xứng bằng cách tuyển mộ và phối hợp hoạt động; thứ hai là định hướng tuyên truyền cho các nhóm xã hội hoặc sự kiện toàn cầu như là một hình thức tâm lý chiến; và thứ ba là cung cấp thông tin một cách nặc danh. Chính bản chất phi luật lệ của môi trường ảo đang tạo ra tính nặc danh, cái thiết yếu cho việc phát tán những quan điểm cực đoan, thông tin giả có chủ đích, và tạo thông tin lừa gạt mà không tiết lộ cá nhân hoặc tổ chức đứng đằng sau.

Thêm vào đó, các đối thủ phi đối xứng và lai có thể đặc biệt linh hoạt trong việc chế biến và vũ khí hóa truyền thông xã hội, dù cơ sở công nghệ có hạn. Việc sử dụng công nghệ theo những cách khó lường trong tác chiến lai thực chất là tiếp thu một công nghệ có sẵn để đáp ứng một yêu cầu cụ thể, chứ không thiết kế ra một hệ thống mới. Thí dụ, các phương tiện truyền tin, máy tính và các công cụ quản lý thông tin khác đã được áp dụng cho một cấu trúc lực lượng quân sự về cơ bản không thay đổi.

Để đối phó, quân đội nhiều nước đang nhanh chóng tổ chức các nhóm đặc nhiệm và xây dựng mới các năng lực tình báo xã hội SOCMINT để xử lý cụ thể các nền tảng truyền thông xã hội. Do có cấu trúc tương đối cứng nhắc, tác chiến truyền thống không theo kịp những bước tiến của kỷ nguyên thông tin, các quân đội hiện đại đang cải biến dần học thuyết và quá trình mua sắm vũ khí trang bị, tập trung vào các vấn đề huấn luyện và nghiên cứu, và khai thác các công nghệ mới nổi để thích nghi.

Nhiều ý kiến cho rằng, phải nêu rõ những thay đổi lớn trong điều khiển học. Ngày nay sự thay đổi này đang ngày càng được cảnh báo rõ ràng hơn. Sự tiến hóa của đe dọa đang được quan sát thường xuyên hơn: có nhiều mối đe dọa hơn, nhiều dữ liệu hơn, nhiều kết nối hơn..., mọi sự vật đều nhiều hơn. Song thay đổi chính trong 5 năm qua là những người tham gia kết nối mạng đã hiểu rằng điều khiển học là một vấn đề quan trọng và đang tồn tại một mối đe dọa trong đó, cho nên họ cần thận trọng khi tác nghiệp trong không gian điều khiển học.

Australia, Israel, Anh và Mỹ đã phát triển các năng lực để giải quyết cụ thể vấn đề theo dõi và xử lý truyền thông xã hội, cũng như để thu thập và phân tích tình báo xã hội. Đơn vị Spokeperson thuộc quân đội Israel đã giải quyết vấn đề với YouTube, Twitter và Facebook ngay từ 2008. Năm 2015, Security Assurance Group thuộc lục quân Anh đã được cải tổ lại thành Lữ đoàn 77, nơi thực hiện các năng lực tác chiến phi sát thương, như phân tích hành vi của đối thủ, người dùng Internet và đối phương cũng như tác nghiệp truyền thông và các hoạt động đặc biệt khác. 

Các loại hình lực lượng đặc biệt này tập trung theo dõi hoạt động truyền thông xã hội, nhằm nhận dạng, quan sát và bám theo các đe dọa tiềm tàng. Có thể theo “vết” các phát ngôn tương đối công khai để thấy mối liên hệ giữa các mối đe dọa tiềm tàng với các sự kiện và vấn đề an ninh hiện thời. Các mạng xã hội có thể được ghi vào bản đồ và phác họa trong một chỉnh thể chung, nhằm nhận dạng những nút then chốt là nguồn hoặc mục tiêu của thông tin. Thí dụ, máy tìm tin phân tích trên cơ sở trang web Echosec đã khai thác khoảng 500 đường dẫn dữ liệu nguồn mở và được thiết kế để phát hiện những người sử dụng truyền thông công cộng trên mạng theo thời gian thực. Quân đội một số nước đang sử dụng Echosec để nhận dạng các nguồn rò rỉ tiềm tàng và xác định chính xác thời gian và địa điểm xuất phát của các tin đăng lên truyền thông xã hội.

Nhờ Echosec, sự vật được lọc theo không gian, nhờ đó biết được địa điểm (các điểm đăng tin được định vị) và nhờ một số chương trình về các hệ thống thông tin địa lý để hiển thị dữ liệu đó. Quá trình lọc theo thời gian cũng được thực hiện, vì lát cắt thời gian trong một vùng đặc thù là thiết yếu. Như vậy, khi tìm kiếm một sự vật nhất định, như âm mưu đảo chính đã diễn ra tại Thổ Nhĩ Kỳ (7/2016), thì chỉ cần tìm kiếm thông tin trong ngày đó trong vùng đặc thù nhất định, và số lượng các bộ lọc được giảm đi đáng kể.
Wikistrat sử dụng phương pháp theo dõi truyền thông xã hội theo thời gian thực tương tự, nhằm nhận dạng và bám theo chuyển động của xe bọc thép và binh lính cơ động tại Ukraina trong thời gian Nga sáp nhập Crimea năm 2014. Đáng chú ý, phương pháp Wikistrat sử dụng nguồn đám đông, nghĩa là được mở cho bất kỳ ai muốn góp tin, tương tự như cách Wikipedia phát triển cơ sở tri thức. Ảnh, video clip, dữ liệu vị trí địa lý được thẩm định và lọc qua một dịch vụ trực tuyến gọi là Checkdesk, một bộ công cụ nguồn mở để quản lý, thẩm định và công bố trực tuyến các nội dung do người sử dụng tạo ra, và các dữ liệu này được dẫn qua một nền tảng công bố và hiển thị dữ liệu khác gọi là Silk.

Leidos cũng đã phát triển một số công cụ để khai thác thông tin sẵn có trong công chúng, được thiết kế để phân tích và hiển thị các dữ liệu nguồn mở, kể cả các mạng xã hội khép kín được các cơ quan tình báo sử dụng, nhằm đánh dấu các hiện tượng truyền tin bất thường và chỉ rõ hoạt động bất thường của các nhân viên tình báo.

Trên chiến trường, thông tin giả mạo hoặc vị trí giả có thể được gắn vào các tin được đăng trên truyền thông xã hội, nhằm đánh lừa đối phương hoặc dẫn dụ họ vào một vị thế dễ bị xâm hại. Tuy nhiên, các chiến binh không được huấn luyện cũng có thể làm rò rỉ thông tin qua công nghệ kết nối. Sự rò rỉ cũng đã gia tăng trong suốt 5 năm qua do việc trò chơi hóa nhiều nền tảng truyền thông xã hội. Rò rỉ còn có thể xuất hiện khi các chuyên gia đăng lên mạng những chi tiết cụ thể về các dự án họ đã làm, chẳng hạn, để bổ sung cho bản sơ yếu lý lịch tại nơi xin việc....

Bởi vậy, ý đồ kiểm soát việc chia sẻ và phân phối thông tin qua các nền tảng truyền thông xã hội khó có thể thành công. Khối lượng, tốc độ và tính đa dạng thông tin bị theo dõi có thể tạo ra các tệp dữ liệu và các dòng tin siêu lớn, khó có khả năng nhận biết nội dung để có thể quản lý và hành động phù hợp. 

Vấn đề xử lý dữ liệu lớn

Dữ liệu lớn (Bigdata) là thuật ngữ gắn với sự gia tăng không ngừng của thông tin số (do sự lan rộng của các nền tảng dựa trên trang web) và số người sử dụng Internet. Các hệ thống truy cập web di động, dựa trên điện toán đám mây, Internet vạn vật, GPS và các dịch vụ vị trí khác, các bình luận cá nhân, giao lưu, các chỉ số rating phổ dụng, các dòng dữ liệu (dù do con người tạo ra, diễn ra trong tự nhiên, hoặc kết quả của thuật toán), và thậm chí  thông tin về thời tiết, đường giao thông và điều kiện các tuyến vận tải công cộng sẵn có, tất cả đều là một bộ phận của tình báo truyền thông xã hội SOCMINT quy mô lớn và đa dạng. Các thế lực sử dụng công nghệ đã có thể thu thập lượng lớn dữ liệu, song lại không thể khai thác những lợi ích cốt lõi từ nguồn dữ liệu khổng lồ đó để tách ra những thông tin hữu ích. Mặc dù công cụ tự động hóa có thể đánh dấu và theo dõi dữ liệu, song không phải mọi dữ liệu đều gắn với các cá nhân hoặc sự kiện thực. Đó chính là thách thức đối với vấn đề dữ liệu lớn.

Ngày nay, nhiều tổ chức đang cố gắng tìm kiếm giải pháp cho một số thách thức trong truyền thông xã hội, như xác định danh tính người tham gia mạng xã hội, thậm chí  khi người đó có nhiều tài khoản truyền thông xã hội  khác nhau (độ phân giải nhận dạng); xác định chính xác địa điểm vật chất của chủ tài khoản (thuộc tính địa lý) để có thể đưa ra biện pháp xử lý trong thế giới thực. 

Khi công nghệ cho phép làm điều đó, thì người ta sẽ có khả năng giảm nhẹ nhiều mối đe dọa trong không gian điều khiển học vì sẽ không có hành động xấu nào không bị đáp trả. Điều có cũng có tính răn đe đối với những hành vi phi pháp trên không gian mạng.

Tháng 8/2015, Không quân Mỹ đã công bố chương trình Trích xuất và Phân tích mạng thông tin đa nguồn (MUCENA). Chương trình này nhằm phát triển các công cụ và thuật toán phân tích để giải quyết những thách thức đa nguồn và khai thác truyền thông xã hội, tạo ra các công cụ phân tích tính năng cao, có độ chính xác cao và dễ thích nghi để đánh giá, lý giải và dự báo mối đe dọa quanh các cá nhân, nhóm và sự kiện có liên quan, nhằm hiểu sâu hơn về thông tin để có thể rút ra từ các văn bản phi cấu trúc đa nguồn.

Trong năm 2015, Cục Dự án nghiên cứu quốc phòng cao cấp DARPA Mỹ cũng đã tiết lộ những kết quả đầu tiên của chương trình Memex. Đó là chương trình phát triển các công nghệ khảo cứu thế hệ mới, có tác dụng tương tác với thông tin được chia sẻ và cải thiện khả năng phát hiện nội dung, trích xuất, truy cập thông tin, cộng tác người sử dụng và các chức năng khảo cứu then chốt khác, kể cả phát hiện các nội dung phi truyền thống ẩn sâu trong trang web và nội dung cụ thể trong các mạng ẩn danh như Tor, I2P và Freenet.

Các công nghệ có khả năng như chỉnh sửa tên miền, trích xuất sự kiện phức tạp, phân tích ngôn từ và khai thác văn bản cũng có tác dụng giải quyết những thách thức của việc tạo những thông tin động, có “vấn đề” từ hàng tỷ tin được đăng trên truyền thông xã hội, do hàng triệu người sử dụng tạo ra. Những bước tiến trong khai thác dữ liệu nguồn mở, trí tuệ nhân tạo, học hỏi máy có chiều sâu (các thuật toán cao cấp để giải mã các kiến trúc mạng phức tạp) cũng đang được áp dụng vào các vấn đề dữ liệu lớn. Quân đội các nước có thể có khả năng thích nghi với quá trình chuyển đổi số của tác chiến hiện đại bằng cách đầu tư vào các công cụ phân tích sâu để khai thác các nút thông tin, trích xuất các khuynh hướng và hình mẫu then chốt nhằm hỗ trợ cho hoạch định tác chiến, phục vụ mục đích khai thác truyền thông xã hội như là một công cụ của sức mạnh quốc gia.