Làm thế nào để vượt qua các giới hạn của deep learning


Làm thế nào để vượt qua các giới hạn của deep learning

Nguyễn Kim 10:20 27/11/2017

Deep learning là một thuật ngữ nói về các chương trình giúp máy tính phân tích dữ liệu và tự học. Tạp chí Technology Reviews đã chỉ ra các vấn đề hiện tại của công nghệ này và mở vài cánh cửa với những nghiên cứu mới. Thực tế, deep learning không phải là một công nghệ mới, trái lại nó đã có từ khá lâu.

Vì sao AI (trí thông minh nhân tạo) cần đến dữ liệu lớn (big data)

Nền tảng của"deep learning" là một công nghệ có tên Backpropagation, phát triển bởi Geoffrey Hinton trong năm 1986. Chính phương pháp này cho phép một chương trình học hỏi từ mạng lưới “tế bào thần kinh- neuron” được tạo thành bởi các đơn vị nhỏ. Những "neuron" sẽ hoạt động khi nó nhận đủ đầu vào từ các neuron khác để vượt qua một ngưỡng nào đó. Một hệ thống như vậy có thể được sử dụng để nhận biết sự xuất hiện của một vật thể chuyên biệt.

Cụ thể như, trong một tấm ảnh có hình bánhmì xúc xích, ở đỉnh của mạng lưới, có thể có hai neuron, một sẽ hoạt động khi nhìn thấy một cái bánh mì kẹp, cái kia hoạt động ngược lại khi không có. Người ta tiếp tục đưa ra cho hệ thống này một loạt hình ảnh, càng nhiều càng tốt. Nếu trong một lần nào đó mà chương trình bị nhầm, nếu nó nhìn thấy bánh kẹp ở chỗ không có, người ta sẽ xem những neuron nào ở các lớp trước lớp sau cùng đã kích hoạt và phát tín hiệu sai. Và họ sẽ thay đổi mức kích hoạt của nó. Sau đó người ta lại sửa các lớp trước đó để xem tiếp xem là những neuron "sai" này đã được kích hoạt thế nào, và cứ thế quay lại cho đến lớp đầu tiên.

Vào năm 2012, Hinton đã có thể trình bày khả năng thực hiện một nhận biết hình ảnh khá hiệu quả. Tuy nhiên, giống như tạp chí MIT đã đề cập, đặc điểm khá cũ của "deep learning" khiến chúng ta phải đặt ra câu hỏi về ý nghĩa của những chấn động ngày nay.

Trí thông minh nhân tạo ngày nay, chính là deep learning. Và deep learning chính là Backpropagation - điều đáng ngạc nhiên khi người ta nghĩ đến việc công nghệ này đã có hơn 30 năm tuổi... Có thể chúng ta không phải đang ở khởi đầu một cuộc cách mạng, mà là thời kỳ cuối của nó.

Bởi vì, những hệ thống này không tiến bộ gì nhiều về việc làm cho máy tính hiểu biết thế giới. Đó chỉ là những hệ thống nhận biết các mẫu, các sơ đồ.

Một máy tính nhìn thấy một chồng bánh rán ở trên bàn và mô tả nó một cách tự động là "một chồng bánh rán ở trên bàn". Nhưng khi chính chương trình này nhìn thấy một cô bé đánh răng và nói "một chú bé cầm một chiếc gậy bóng chày", bạn sẽ nhận ra rằng sự hiểu biết này yếu ớt thế nào, và thậm chí nó chưa hề tồn tại.

Trí tuệ của máy móc, nếu chúng ta có thể gọi nó như vậy, trên hết dựa vào dữ liệu lớn (big data) để hướng dẫn cho một cái máy nhận biết bánh mì kẹp, cần chỉ cho nó hàng triệu bức ảnh bánh mì kẹp. Ngược lại, một đứa bé có thể nhận biết bánh mì kẹp chỉ sau khi nhìn thấy nó một lần.

Vấn đề lớn nhấtlà chúng ta không có lý thuyết về trí tuệ, cho phép chúng ta hiểu nó vận hành như thế nào. Vì lý do đó mà từ khi có công trình của Hinton, những tiến triển của AI thực tế là kỹ thuật (hoặc, công việc "sửa chữa") mà khoa học đã chỉ ra xác đáng là vậy. Chúng ta bổ sung một vài chỗ để hoàn thiện thuật toán, và chúng ta tiến hành thử nghiệm và sai lầm.

Mang lại cho máy móc một sự hiểu biết về thế giới

Làm sao để đi xa hơn? Sự thể hiện của deep learning là không đủ để tạo ra trí tuệ nhân tạo, tương đương với trí tuệ con người. Nói cách khác, làm sao để trang bị cho nó một hiểu biết "theo lý lẽ thường" -câu hỏi được đặt ra từ khi bắt đầu sáng chế lĩnh vực này năm 1956 và chưa bao giờ được giải đáp.

Một vấn đề cũng quan trọng không kém được đặt ra khi an ninh ở thế giới thật của con người bị đe doạ, như trong ví dụ với những chiếc xe ôtô tự lái. Một bài báo khác của Technology Review giới thiệu dự án khởi nghiệp của MIT - ISee. Dự án tìm kiếm những cảm hứng khoa học về nhận thức của tâm lý học của con người, để trang bị cho các phương tiện giao thông tương lai.

Đa số loài người sử dụng những kinh nghiệm và cách thông thường để điều khiển phương tiện, một cách mà một hệ thống nhận biết mẫu dựa trên dữ liệu lớn không thể sánh bằng. Những người lái xe biết rằng, nếu xe bus dừng quá lâu thì sẽ có quá nhiều người lên. Nó sẽ là không thể lập trình cho một chiếc xe tự lái cho tất cả các tình huống có thể xảy ra ở trên đường. Nhưng con người thì có thể sử dụng những hiểu biết chung của mình về thế giới, được xây dựng qua kinh nghiệm trong cuộc sống, để hành động một cách xác đáng trong tất cả các kiểu hoàn cảnh mới.

Nhưng làm thế nào? Chúng ta biết rằng những nền móng của ISee được phát hiện trong phòng thí nghiệm của một giáo sư của MIT, Joshua Tenenbaum, người làm việc trên một công nghệ cho phép vừa tránh được những khó khăn của chương trình AI truyền thống, mà dựa trên những quy tắc cố định và những công nghệ về big learning cho phép làm việc với hàng triệu dữ liệu. Ông đã thành công, cùng với hai nhà nghiên cứu khác, Brenden Lake và Ruslan Salakhutdinov tạo ra một hệ thống phần mềm có khả năng nhận biết một đặc điểm hệ chữ viết sau khi chỉ cần xem một ví dụ. Phương pháp này được gọi là Bayesian Program Learning Framework. Tóm lại, hệ thống hình thành cho mỗi ký tự một chương trình đặc biệt có khả năng tự tạo sau đó suy ra một loạt các khả năng để định nghĩa đâu là hành vi tiếp theo để thực hiện.

Giáo sư Joshua Tenenbaum

"Chìa khoá của chương trình khả năng đúng - hay sự khác biệt với cách mà deep learning vận hành - là nó bắt đầu bằng một chương trình mô tả những quan hệ nhân quả tồn tại trên thế giới... Những gì chúng ta thử nắm bắt không phải là một chữ ký hay một mẫu đặc biệt. Chúng tôi thử học cho một chương trình làm thế nào để phát triển đặc điểm của chính nó." Nói cách khác chúng ta dạy cho máy tính "viết" các chữ này để có thể nhận ra được nó.

Với sự hỗ trợ của kiểu phương pháp này, người ta hy vọng rằng máy tính sẽ có khả năng quan sát một cách mới, để phân tích thành các thành phần nhỏ, sau đó có khả năng dự đoán những kết quả của một hành động, ngay cả khi nó xảy ra lần đầu tiên. Mục tiêu của nghiên cứu như thế này là để đoán ý định đằng sau một hành động, thứ hiển nhiên và sống còn trong lĩnh vực lái xe tự động.

Trong phòng thí nghiệm của mình, Tenenbaum quan tâm đến cơ chế nhận thức của trẻ em và người lớn, và không chỉ là của trí tuệ nhân tạo. Hai chương trình này là không thể tách rời, kéo lại gần hơn những thuật toán học hỏi tự động với những khả năng học của con người có thể đưa đến những hệ thống AI hoàn chỉnh hơn cũng như những lý thuyết biến hoá mạnh mẽ hơn để hiểu về nhận thức con người.

Quay trở về với khoa học nhận thức

Tương lai của AI phụ thuộc vào một sự quay trở lại với khoa học nhận thức, về tâm lý học của loài người. Nếu Technology Review tập trung vào những nhà nghiên cứu của MIT và các đồng nghiệp (điều khá dễ hiểu vì tạp chí này thuộc MIT), thì đây là một cảm giác chung với nhiều thành viên khác của cộng đồng nghiên cứu AI. Ví dụ như trường hợp của tác giả và nhà nghiên cứu Gary Marcus, người đã viết, trong một bài báo trên New York Times: "Không lâu trước đây, ví dụ như, khi tôi ngồi trong quán cà phê, con gái ba tuổi của tôi nhận ra một cách tự động rằng cháu có thể nhảy xuống khỏi ghế theo một cách mới: từ phía đằng sau, bằng cách luồn vào giữa lưng ghế và mặt ghế. Con gái tôi chưa bao giờ nhìn thấy ai đó làm điều này; cháu tự sáng tác ra - mà không cần phải thử nghiệm và mắc sai lầm, hay cần những dữ liệu nào. Tôi cho rằng con gái tôi dựa trên một lý thuyết ngầm về cách mà cơ thể chúng ta dịch chuyển, cũng như một lý thuyết ngầm về vật lý - làm thế nào mà một vật thể phức tạp đi qua được sự mở của một vật thể khác. Tôi nghi ngờ rằng không có robot nào có thể làm giống như vậy."

Với Marcus, ngày nay phải học cách tiếp cận "từ dưới lên" và "từ trên xuống" của trí tuệ. Sự nhận thức từ dưới lên là kiểu thông tin thô mà chúng ta nhận một cách trực tiếp từ cảm giác, như một mô típ ánh sáng rơi trên võng mạc. Nhận thức từ trên xuống hiểu những mô hình nhận thức thế giới và nó vận hành như thế nào.

Cuối cùng thì, có phải chúng ta lại đang đối diện với một con rắn tự cắn vào đuôi mình? Trong hàng năm trời người ta tìm kiếm để mang đến cho các máy tính những mẫu hình về thế giới, để dạy cho chúng biết "lẽ thường". Một dự án như là Cyc của Douglas Lenat (bắt đầu từ tận năm 1984) cũng không có mục đích nào khác. Rồi người ta đã bỏ quên cách này để tập trung vào mạng lưới neurone, để phát hiện ra có lẽ là ngày nay chúng ta đã vứt đi cả rác lẫn vàng thau.


Nguyễn Kim