Lỗi trong hệ thống phát hiện AI

Trí tuệ nhân tạo đã trở thành một công cụ thiết yếu trong giáo dục, xuất bản, báo chí và kinh doanh. Một trong những ứng dụng phát triển nhanh của nó là phần mềm phát hiện nội dung AI tuyên bố xác định xem một văn bản được viết bởi con người hay bởi một hệ thống AI tạo ra.

Mặc dù những công cụ như vậy có thể hữu ích, nhưng chúng còn lâu mới hoàn hảo. Lỗi phát hiện AI ngày càng phổ biến, dẫn đến những cáo buộc sai đối với sinh viên, nhà nghiên cứu và thậm chí cả các chuyên gia. Trong một số trường hợp, sự nghiệp và danh tiếng đã bị tổn hại do phụ thuộc vào các phương pháp phát hiện thiếu sót.

Bài viết này khám phá các loại lỗi phát hiện AI, cung cấp các ví dụ thực tế về các trường hợp nổi tiếng và đề xuất các chiến lược thực tế để tránh sai lầm khi sử dụng các công cụ này.

Lỗi phát hiện AI là gì?

Công cụ phát hiện AI phân tích văn bản bằng các thuật toán đo lường các tính năng ngôn ngữ như lựa chọn từ, độ phức tạp của câu hoặc khả năng dự đoán. Ý tưởng là văn bản do AI tạo ra có xu hướng khác với cách viết của con người.

Tuy nhiên, các hệ thống này không hoàn hảo. Lỗi phát hiện AI xảy ra khi các công cụ phân loại văn bản con người không chính xác là AI được viết hoặc khi chúng không nhận ra tác phẩm do AI tạo ra thực tế.

Những sai lầm như vậy có thể có ý nghĩa nghiêm trọng:

Học sinh có thể bị buộc tội sai vì gian lận.
Các nhà báo hoặc nhà văn có thể phải đối mặt với những tuyên bố đạo văn sai lầm.
Các tổ chức có thể đưa ra các quyết định chính sách dựa trên bằng chứng không đáng tin cậy.

Các loại lỗi phát hiện AI phổ biến

Công cụ phát hiện AI — mặc dù cực kỳ hữu ích — không miễn nhiễm với sai lầm. Dưới đây là một số ví dụ thuyết phục về lỗi phát hiện AI làm nổi bật những hạn chế và câu hỏi của chúng:

1. dương tính giả: văn bản con người được gắn cờ là AI

Đây là một trong những lỗi phổ biến và gây khó chịu nhất, đặc biệt là trong môi trường học thuật hoặc chuyên nghiệp. Một kết quả dương tính giả xảy ra khi văn bản xác thực của con người bị dán nhãn sai là do AI tạo ra.

Ví dụ 1: Một học sinh viết một bài luận cá nhân chân thành về việc vượt qua nghịch cảnh. Chữ viết được trau chuốt nhưng đầy cảm xúc và phản chiếu. Một máy dò AI đánh dấu nó là 85% do AI tạo ra do các đoạn văn có cấu trúc và giọng điệu trang trọng.
Tại sao điều đó xảy ra: Máy dò AI thường liên kết ngữ pháp rõ ràng và luồng logic với việc viết máy, ngay cả khi đó chỉ là cách viết tốt của con người.

Ví dụ 2: Năm 2023, một số sinh viên Đại học Hoa Kỳ cho biết đã bị buộc tội sai khi sử dụng chatGPT trong các bài tập, mặc dù họ đã viết chúng một cách độc lập. Các giáo sư dựa vào các công cụ phát hiện thiếu sót đã trừng phạt sinh viên một cách nhầm lẫn, dẫn đến tranh chấp điểm số và khiếu nại pháp lý.

Tại sao nó xảy ra:

Văn bản của con người đơn giản, công thức, hoặc ngữ pháp “quá hoàn hảo” có thể giống với đầu ra của AI.
Các nhà văn tiếng Anh không phải là người bản ngữ thường tạo ra các mẫu văn bản gây nhầm lẫn cho máy dò.

2. Tiêu cực sai: Văn bản AI được chuyển thành con người

Một số nội dung do AI tạo ra được chỉnh sửa hoặc chỉnh sửa tốt đến mức các máy dò bỏ lỡ nó hoàn toàn. Một tiêu cực sai xảy ra khi một văn bản do AI tạo ra được phân loại không chính xác là do con người viết.

Ví dụ 1: Một nhà tiếp thị sử dụng chatGPT để soạn thảo một bài đăng trên blog, sau đó viết lại những câu quan trọng và thêm vào những giai thoại cá nhân. Phiên bản cuối cùng được gắn cờ là 100% do con người viết.

Tại sao nó xảy ra:

Ví dụ 2: Trong xuất bản, các nhà nghiên cứu đã phát hiện ra rằng một số bản tóm tắt khoa học được viết bởi AI được thông qua mà không bị phát hiện qua các máy dò AI, chỉ để sau đó được tiếp xúc bởi những người đánh giá đồng nghiệp, những người nhận thấy phong cách mâu thuẫn.

Tại sao điều đó xảy ra:

Kỹ thuật thúc đẩy nâng cao làm cho nội dung do AI tạo ra giống con người hơn.
Máy dò đấu tranh với các văn bản kết hợp nơi con người chỉnh sửa bản nháp AI.

3. Xác định sai kiểu AI

Máy dò AI đôi khi dựa vào các dấu hiệu phong cách như lặp lại, cụm từ chung chung hoặc thiếu sắc thái cảm xúc. Nhưng những thứ này không dành riêng cho máy móc.

Ví dụ: Một bản ghi nhớ của công ty được viết bởi một con người bao gồm các cụm từ như “hợp đồng các nhóm chức năng chéo” và “các giải pháp có thể mở rộng đòn bẩy.” Máy dò gắn cờ nó là AI do các từ thông dụng bị lạm dụng quá mức.

Tại sao điều đó xảy ra: Máy dò AI thường nhầm lẫn giữa các thuật ngữ hoặc chữ viết nặng với đầu ra của máy.

4. Sự phụ thuộc quá nhiều vào cấu trúc câu

Một số công cụ phân tích độ dài và độ phức tạp của câu để xác định quyền tác giả.

Ví dụ: Một giáo sư viết một bản tóm tắt nghiên cứu bằng cách sử dụng các câu ngắn gọn, súc tích. Trình kiểm tra AI đánh dấu nó là 70% do AI tạo ra vì nó thiếu cấu trúc câu đa dạng.

Tại sao điều đó xảy ra: Máy dò AI có thể liên kết sự ngắn gọn và đồng nhất với văn bản do máy tạo ra, ngay cả khi đó là cố ý.

5. Quá nhạy cảm với phong cách ngôn ngữ

Một số máy dò nhầm lẫn giữa các phong cách viết khác thường hoặc một số nền ngôn ngữ nhất định với đầu ra AI.

Ví dụ: Một sinh viên đến từ Ấn Độ đã có tuyên bố cá nhân của họ được gắn cờ bởi công cụ phát hiện AI của Turnitin vì “phrasing có thể dự đoán được”, mặc dù nó là nguyên bản và xác thực. Sau khi xem xét, yêu cầu đã bị lật lại.

Tại sao điều đó xảy ra:

Các công cụ phát hiện AI thường được đào tạo về dữ liệu tiếng Anh từ ngữ cảnh phương Tây.
Các nhà văn từ các nền văn hóa hoặc ngôn ngữ đa dạng có thể vô tình “kích hoạt” thuật toán.

6. Sự phụ thuộc quá mức vào các chỉ số xác suất

Máy dò AI thường sử dụng điểm “lúng túng” (văn bản có thể dự đoán được như thế nào) để quyết định xem có thứ gì đó trông giống như AI được viết hay không. Nhưng văn bản có thể dự đoán được không bằng AI do AI tạo.

Ví dụ: Sách thiếu nhi, sách hướng dẫn sử dụng và thậm chí cả những đoạn Kinh Thánh đã bị gắn cờ giả là nội dung AI vì cấu trúc lặp đi lặp lại hoặc đơn giản của chúng.

Tại sao nó xảy ra: Một số kiểu viết của con người là đơn giản hoặc công thức. Máy dò nhầm sự rõ ràng với tính giả tạo.

7. Sự nhầm lẫn văn bản kết hợp

Nhiều người hiện sử dụng AI để động não, phác thảo hoặc đánh bóng văn bản mà không hoàn toàn dựa vào nó. Máy dò thường phải vật lộn với những trường hợp “hỗn hợp” này.

Ví dụ: Một nhà báo đã sử dụng AI để đưa ra các đề xuất tiêu đề nhưng đã tự viết bài báo. Toàn bộ tác phẩm đã được gắn cờ là AI-được viết bởi phần mềm phát hiện, gây ra việc xem xét biên tập không cần thiết.

Tại sao điều đó xảy ra: Công cụ phát hiện không thể dễ dàng tách các yếu tố hỗ trợ AI ra khỏi văn bản của con người.

Các trường hợp phát hiện AI nổi tiếng trên thế giới

1. Sinh viên Texas bị buộc tội sai

Năm 2023, một giáo sư đại học ở Texas đã cáo buộc cả một lớp sử dụng chatGPT cho các bài luận sau khi chạy công việc của họ thông qua một máy dò AI. Một số học sinh phải đối mặt với hành động kỷ luật, mặc dù có bằng chứng (bản thảo, ghi chú, dấu thời gian) rằng họ đã tự viết bài tập. Câu chuyện này lan truyền và trở thành biểu tượng của việc thực thi AI thiếu sót trong giáo dục.

2. Princeton Computer Science Research

Một nghiên cứu của Princeton phát hiện ra rằng các công cụ phát hiện AI thường gắn cờ các nhà văn không phải người bản ngữ không công bằng. Các bài luận của con người từ các sinh viên ESL được dán nhãn sai là do AI viết lên đến 60% thời gian, trong khi các bài luận về AI được đánh bóng đôi khi không bị phát hiện.

3. Cuộc khủng hoảng xuất bản khoa học

Năm 2024, các nhà xuất bản học thuật đã báo cáo hàng nghìn bài nộp do AI tạo ra bị nghi ngờ. Trong khi các máy dò gắn cờ nhiều bài báo, những người đánh giá ngang hàng sau đó đã phát hiện ra rằng một số tác phẩm “cờ” là xác thực, trong khi các bài báo AI khác lại lọt qua. Điều này đã tạo ra cuộc tranh luận rộng rãi về việc liệu máy dò có nên được sử dụng làm người gác cổng cho nghiên cứu hay không.

4. Sự sụp đổ của báo chí AI của CNET

Vào năm 2023, CNET đã bị lộ vì xuất bản các bài báo tài chính do AI tạo ra mà không tiết lộ. Trớ trêu thay, một số bài báo này được chuyển qua phần mềm phát hiện mà không được chú ý. Đồng thời, các nhà báo cáo buộc các máy dò AI đã gắn cờ tác phẩm xác thực của họ. Thất bại kép này làm nổi bật cả âm tính giả và dương tính giả trong một trường hợp cao cấp.

5. Các cuộc tranh cãi về kỳ thi trung học

Ở một số quốc gia châu Âu, học sinh trung học có các bài luận được gắn cờ bởi phần mềm phát hiện AI được sử dụng trong quá trình kiểm tra tiêu chuẩn. Kháng cáo cho thấy nhiều cáo buộc là sai, làm dấy lên lo ngại về sự công bằng trong hệ thống giáo dục dựa vào tự động hóa.

Lỗi phát hiện AI trong thế giới thực

Sự cố Chevrolet Chatbot
Một người dùng đã lừa một chatbot dịch vụ khách hàng đồng ý bán một chiếc xe hơi với giá 1 đô la. BOT đã chấp nhận thỏa thuận và xác nhận nó là ràng buộc về mặt pháp lý.
Bài học: Hệ thống AI có thể bị thao túng nếu chúng thiếu các biện pháp bảo vệ thích hợp và kết quả đầu ra của chúng có thể bị hiểu sai là có thẩm quyền.
bot hoàn tiền của Air Canada
Một chatbot đã cung cấp thông tin hoàn tiền không chính xác cho hành khách. Hãng hàng không từ chối tôn trọng nó, nhưng một tòa án đã ra phán quyết rằng công ty chịu trách nhiệm về phản ứng của BOT.
Bài học: Nội dung do AI tạo, ngay cả khi sai, có thể gây ra hậu quả trong thế giới thực nếu người dùng dựa vào đó là sự thật.
Lỗi tư vấn sức khỏe chatgpt
Một người đàn ông đã làm theo lời khuyên của Chatgpt để loại bỏ muối bằng cách dùng natri bromide. Anh ấy phát triển một tình trạng hiếm gặp và phải nhập viện.
Bài học: Lời khuyên do AI tạo ra, đặc biệt là trong các lĩnh vực nhạy cảm như sức khỏe, phải được đánh giá nghiêm túc và các máy dò nên gắn cờ nội dung rủi ro hoặc ảo giác.

Cách tránh lỗi phát hiện AI

1. Đối với sinh viên và nhà văn

Giữ bản nháp và ghi chú: Lưu nhiều phiên bản để hiển thị quá trình viết của bạn.
Sử dụng trình kiểm tra đạo văn thay vì máy dò AI: Công cụ đạo văn đáng tin cậy hơn để trung thực trong học tập.
Tính minh bạch: Nếu bạn sử dụng AI để động não, hãy tiết lộ nó.

2. Đối với các nhà giáo dục và tổ chức

Đừng chỉ dựa vào máy dò AI: sử dụng chúng như một tín hiệu, không phải bằng chứng.
Tập trung vào quy trình, không chỉ sản phẩm: bảo vệ miệng, ghi nhật ký và đánh giá ngang hàng giúp xác thực quyền tác giả.
Cung cấp hướng dẫn: dạy học sinh cách AI có thể được sử dụng một cách có đạo đức.

3. Đối với các nhà báo và nhà xuất bản

Xác minh các văn bản đáng ngờ theo cách thủ công: Các biên tập viên nên dựa vào đánh giá của con người, chứ không phải chỉ các thuật toán.
Khuyến khích tính minh bạch: Người viết nên tiết lộ AI được sử dụng trong tiêu đề, bản nháp hay định dạng.
Áp dụng các chính sách kết hợp: chấp nhận công việc có sự hỗ trợ của AI nếu được thừa nhận đúng cách.

Các phương pháp hay nhất để tránh lỗi phát hiện

Sử dụng nhiều công cụ: Đừng dựa vào một trình kiểm tra AI. kết quả tham chiếu chéo.
Đánh giá của con người: Luôn kết hợp phát hiện AI với đánh giá của chuyên gia.
Vấn đề bối cảnh: Xem xét mục đích, giọng điệu và lịch sử chỉnh sửa của nội dung.
Minh bạch: Nếu sử dụng AI để hỗ trợ viết, hãy tiết lộ nó khi thích hợp.

Tại sao những lỗi này lại quan trọng

Công cụ phát hiện AI ngày càng được sử dụng nhiều hơn trong:

Giáo dục (để ngăn chặn gian lận)
Xuất bản (để xác minh tính nguyên bản)
Thuê (để sàng lọc hồ sơ)
Pháp lý và Tuân thủ (để đảm bảo quyền tác giả của con người)

Nhưng khi họ phạm lỗi, họ có thể:

Hãy để nội dung do AI viết qua
Làm suy yếu lòng tin vào công việc hợp pháp

Tương lai của phát hiện AI

Sự gia tăng của AI có nghĩa là các công cụ phát hiện sẽ vẫn còn gây tranh cãi. Nhiều chuyên gia dự đoán rằng thay vì cố gắng nắm bắt văn bản AI, các ngành sẽ chuyển sang việc chấp nhận tính minh bạch: yêu cầu các nhà văn, sinh viên hoặc nhà nghiên cứu tiết lộ việc sử dụng AI của họ.

Phần mềm phát hiện vẫn có thể đóng một vai trò nào đó, nhưng nó sẽ cần phải cải thiện đáng kể để tránh làm hại những người viết vô tội hoặc thiếu văn bản do AI tạo ra tinh vi.

Lỗi phát hiện AI cho thấy những hạn chế của công nghệ hiện tại. Từ dương tính giả gây hại cho học sinh đến tiêu cực sai để cho phép báo chí viết bằng AI, rủi ro là có thật. Các trường hợp nổi tiếng, từ vụ bê bối trong lớp học ở Texas đến báo cáo AI của CNET, cho thấy lý do tại sao các tổ chức và cá nhân phải coi máy dò là công cụ dễ sai lầm, chứ không phải thẩm phán cuối cùng.

Con đường tốt nhất về phía trước là sự kết hợp của sự minh bạch, các hướng dẫn đạo đức và phán đoán của con người. Bằng cách học hỏi từ những trường hợp này và hiểu các loại lỗi phát hiện AI, chúng ta có thể sử dụng AI một cách có trách nhiệm mà không làm suy yếu sự công bằng, sáng tạo hoặc tin tưởng.

Lỗi phát hiện AI: loại, trường hợp nổi tiếng và cách tránh chúng