NSA thu thập dữ liệu để phát triển chương trình nhận diện khuôn mặt

09:25 | 03/07/2014

Các tài liệu mật do Edward Snowden tiết lộ cho biết cơ quan an ninh quốc gia Mỹ (NSA) đã và đang tiến hành việc thu thập dữ liệu hình ảnh của người dùng internet trong nhiều năm qua để xây dựng cơ sở dữ liệu hình ảnh phục vụ cho chương trình nhận diện khuôn mặt.


Các dữ liệu sinh trắc khác cũng là mục tiêu của NSA.

Tờ New York Times trích nguồn tài liệu mật cho biết, trong 4 năm qua, NSA đã thu thập "hàng triệu hình ảnh mỗi ngày", trong đó bao gồm khoảng 55.000 "hình ảnh chất lượng có thể nhận diện khuôn mặt". Đây là nguồn dữ liệu khổng lồ mà NSA có thể khai thác đến vô tận.
Theo New York Times, NSA đã chuyển trọng tâm chú ý từ các giao tiếp bằng chữ viết và lời nói trước đây sang hình ảnh khuôn mặt, dấu vân tay và các yếu tố nhận dạng khác, xem đây là những dữ liệu có tầm quan trọng trong sứ mệnh truy tìm nghi phạm khủng bố cũng như các mục tiêu tình báo khác.
Chẳng hạn, một tài liệu Powerpoint của NSA vào năm 2011 đã thể hiện một số ảnh chụp của một người đàn ông không rõ danh tính, lúc thì có râu quai nón, lúc thì mày râu nhẵn nhụi, được chụp trong các bối cảnh khác nhau, kèm theo đó là hàng chục thông tin về nhân thân người này, bao gồm việc ông ta có nằm trong danh sách cấm bay của Cơ quan An toàn Hàng không (TSA) hay không, hộ chiếu và tình trạng visa của ông ta, những bạn bè thân hữu hoặc có liên hệ với khủng bố hay không, và lời nhận xét của người chỉ điểm về ông ta.
Các cơ quan công quyền và thực thi pháp luật ở Mỹ chủ yếu dựa vào các cơ sở dữ liệu hình ảnh khuôn mặt, kể cả hình ảnh trên giấy phép lái xe và mạng xã hội Facebook, để nhận diện các nghi phạm. FBI đang xây dựng một dự án nhận diện tiên tiến trong đó kết hợp giữa hệ thống nhận dạng dấu vân tay tự động với hình ảnh khuôn mặt và các dữ liệu sinh trắc khác.
Trong khi đó, Bộ Ngoại giao Mỹ lại sở hữu một cơ sở dữ liệu hình ảnh khuôn mặt được các chuyên gia đánh giá là lớn nhất trong hệ thống chính quyền liên bang Mỹ, với kho lưu trữ đến hàng trăm triệu ảnh chụp người mang hộ chiếu Mỹ và người nước ngoài xin thị thực nhập cảnh. Và Bộ An ninh Nội địa thì đang triển khai thí điểm tại các sở cảnh sát trên toàn nước Mỹ dự án đối chiếu khuôn mặt nghi phạm trong đám đông.
So với các cơ quan trên, NSA được xem là đặc biệt nhất với năng lực đối chiếu hình ảnh trong số lượng khổng lồ các giao tiếp cá nhân. Để làm được điều đó, lẽ đương nhiên là NSA phải luôn tìm cách cải thiện tính chính xác của hoạt động tình báo tín hiệu nhằm đối phó với các đối thủ tình báo nước ngoài tìm cách tấn công nước Mỹ. NSA không tiếp cận được các cơ sở dữ liệu hình ảnh cấp giấy phép lái xe và hộ chiếu, nhưng cơ quan này có nhiều nguồn khác
để thu thập, kể cả kho dữ liệu của Bộ Ngoại giao và nhất là mạng Internet để thu thập hình ảnh khuôn mặt.
Do cách thu thập đại trà nên không chỉ công dân Mỹ mà cả người nước ngoài có các giao dịch điện tử trên mạng internet đều có thể bị thu thập hình ảnh. Các tổ chức, cá nhân vận động vì quyền tự do công dân ở Mỹ bày tỏ lo ngại với sự tiến bộ vượt bậc của công nghệ hiện đại, vấn đề xâm phạm quyền riêng tư sẽ càng nghiêm trọng hơn.
Không chỉ các cơ quan tình báo như NSA, FBI, CIA,… và các cơ quan khác của Chính phủ Mỹ mà ngay cả các công ty, tập đoàn kinh tế tư nhân cũng đầu tư tiền tỷ để phát triển công nghệ nhận diện khuôn mặt. Các cơ quan công quyền Mỹ hiện đang dẫn đầu hoạt động thu thập và xây dựng các cơ sở dữ liệu khổng lồ để nhận diện khuôn mặt, trong khi giới doanh nghiệp tư nhân thì  thì có thế mạnh về độ chính xác khi nhận diện khuôn mặt người trong bối cảnh phức tạp hơn.
Và việc xâm phạm quyền riêng tư dường như được làm ngơ vì mục đích an ninh quốc gia. Chính phủ Mỹ luôn tìm cách vận động Quốc hội thông qua các dự luật trong đó cho phép các cơ quan tình báo hàng đầu như FBI, CIA, NSA và một số cơ quan phòng chống ma túy, tội phạm, quản lý thực phẩm, dược phẩm được phép do thám công dân Mỹ ở mức độ nhất định. Chẳng hạn, luật quy định việc nghe lén điện thoại và đọc trộm thư điện tử phải được sự đồng ý của một tòa án đặc biệt về vấn đề này mới được phép tiến hành.
Riêng đối với hoạt động thu thập dữ liệu hình ảnh khuôn mặt thì cho đến nay chưa có luật nào (kể cả luật về do thám và luật về quyền riêng tư) quy định cụ thể, chặt chẽ. Chính vì thế mà NSA đã thỏa sức thu thập hình ảnh khuôn mặt hàng triệu người mà không gặp trở ngại nào. Chỉ có điều, do NSA xem hình ảnh là một dạng nội dung giao tiếp cho nên cơ quan này buộc phải được tòa án đồng ý mới có thể thực hiện việc thu thập hình ảnh của công dân Mỹ.


Nhận diện khuôn mặt đang là trọng tâm chú ý mới của NSA.

Tài liệu mật cho biết, NSA bắt đầu tăng tốc sử dụng công nghệ nhận diện khuôn mặt dưới thời Tổng thống Barack Obama, tăng cường các nỗ lực tình báo chống khủng bố sau 2 vụ tấn công hụt khiến Nhà Trắng phải quan tâm mạnh hơn đến công tác ngăn ngừa nghi phạm từ xa.
Việc sử dụng công nghệ nhận diện khuôn mặt của NSA vượt xa những gì mà tờ The Guardian của Anh tiết lộ trước đây về việc NSA hợp tác với Cơ quan Tình báo tín hiệu GCHQ của Anh thu thập hình ảnh cá nhân qua webcam, kể cả các webcam khiêu dâm, của người dùng mạng Yahoo.
NSA bắt đầu đạt bước đột phá về công nghệ vào năm 2010, khi đó các chuyên gia phân tích của cơ quan này bắt đầu đối chiếu các hình ảnh được thu thập từ 2 cơ sở dữ liệu khác nhau - một cơ sở dữ liệu khổng lồ của NSA có tên gọi là PINWALE, và cơ sở dữ liệu chống khủng bố của Chính phủ Mỹ có tên gọi là TIDE.
Khả năng đối chiếu chéo thành công đó đã tạo nên một sự bùng nổ sử dụng hình ảnh phân tích bên trong NSA. Cơ quan này đã cho ra đời những đội "tình báo nhận diện" chuyên thực hiện việc phân tích kết hợp hình ảnh khuôn mặt với các cứ liệu cá nhân khác để phác họa chân dung toàn diện hơn về các đối tượng mục tiêu.
Giới chuyên gia lo ngại, việc sử dụng công nghệ nhận diện khuôn mặt có thể có những sai sót đáng lưu ý, từ đó có thể gây ra các quyết định thiếu chính xác dẫn đến việc nhận diện lầm người.
Dalia B. Megherbi, chuyên gia về công nghệ nhận diện khuôn mặt tại Trường đại học Massachusetts-Lowell phân tích: Hình ảnh được chụp với nhiều góc độ khác nhau, với độ phân giải khác nhau, như hình ảnh chụp với độ phân giải thấp và ảnh chụp khuôn mặt nhìn nghiêng, đều có thể ảnh hưởng đến các thuật toán của trình ứng dụng nhận diện khuôn mặt. Từ đó dễ dẫn đến các sai sót.
Trong các hồ sơ mật của NSA do Snowden tiết lộ cũng đã cho thấy một số trường hợp công nghệ nhận diện đã ráp hình ảnh không đúng đối tượng.
Báo New York Times dẫn một tài liệu Powerpoint của NSA vào năm 2011 cho thấy một sai sót điển hình khi Tundra Freeze - chương trình nhận diện khuôn mặt chủ đạo của NSA được yêu cầu nhận diện các ảnh chụp để đối chiếu hình ảnh của một người đàn ông trẻ có râu quai nón và tóc đen. Chương trình cho ra đến 42 kết quả trong đó có một số không đúng đối tượng, như thể hiện một người đàn ông đứng tuổi thay vì trẻ tuổi như yêu cầu.
Tương tự, một tài liệu NSA khác cũng trong năm 2011 ghi nhận rằng một hệ thống nhận diện khuôn mặt được yêu cầu nhận diện với hình ảnh đầu vào là Osama bin Laden. Kết quả cho ra nhiều người có bộ râu quai nón tương tự nhưng lại không phải là Bin Laden.
Mặc dù vậy, công nghệ nhận diện khuôn mặt vẫn đang là công cụ hữu hiệu của tình báo Mỹ, đặc biệt là NSA. Tài liệu mật của Snowden đã chứng minh nhiều trường hợp nhận diện hình ảnh người chụp với tư thế, bối cảnh khác nhau, hình dạng, trang phục khác nhau nhưng vẫn nhận diện đúng người.
Theo các tài liệu mật, NSA đã xây dựng được những cách phức tạp để tích hợp các chương trình nhận diện khuôn mặt với nhiều cơ sở dữ liệu khác nhau. Cơ quan này có thể can thiệp vào các hội nghị trực tuyến từ xa để thu thập dữ liệu khuôn mặt, thu thập dữ liệu hành khách hàng không và thu thập hình ảnh từ các cơ sở dữ liệu quốc gia về thẻ căn cước của các quốc gia trên thế giới.
Pakistan, Arập Xêút và Iran đang là các quốc gia mục tiêu của NSA. Cơ quan này còn đang nhắm đến việc thu thập cơ sở dữ liệu hình ảnh quét mống mắt thông qua các chương trình do thám điện thoại, email và các phương tiện khác.
Một trong những hoạt động thu thập hình ảnh khuôn mặt rộng rãi nhất của NSA là một chương trình có tên gọi là WELLSPRING trích xuất hình ảnh từ email và các dạng giao tiếp khác, và hiển thị những hình ảnh có thể chứa các hình ảnh từ hộ chiếu. Ngoài các chương trình dựng sẵn, NSA còn sử dụng các công nghệ nhận diện có bán trên thị trường.
Ngoài ra, NSA cũng đang phối hợp CIA và Bộ Ngoại giao Mỹ trong một chương trình có tên gọi là PISCES thu thập dữ liệu sinh trắc của người vượt qua biên giới từ nhiều quốc gia khác nhau. Giờ đây, NSA đã có thể đối chiếu các ảnh chụp từ vệ tinh với các hình ảnh thu thập lén của các cá nhân chụp ngoài trời để xác định địa điểm.
Một số tài liệu mật năm 2011 cho thấy NSA đã đối chiếu được ảnh chụp một nhóm người vui chơi trong một công viên nước với hình ảnh chụp từ vệ tinh và đã xác định chính xác công viên nước đó là ở Pakistan