Machine Learning (ML) là một tập hợp con của trí tuệ nhân tạo (AI) và nó đang nhanh chóng trở thành xương sống của hầu hết các phần mềm hiện nay. Nó tồn tại dưới nhiều hình thức khác nhau, từ chatbot trên các trang web và trợ lý kỹ thuật số như Siri và Alexa, đến các thuật toán điều khiển phương tiện truyền thông xã hội như Facebook và nhiều phần mềm văn phòng khác nhau. Machine Learning rất phổ biến đến mức khó có thể liệt kê tất cả các nơi mà nó tồn tại dưới dạng kỹ thuật số và tất cả các tác vụ mà nó thực hiện.
Mặc dù Machine Learning hiện đang là công nghệ tiên tiến trong cuộc sống và công việc hàng ngày của chúng ta, nhưng nó đã tồn tại trong một thời gian dài. Lịch sử của Machine Learning rất hấp dẫn và đáng ngạc nhiên khi xét đến việc nó đã bắt nguồn từ rất lâu. Những tiến bộ dường như nhanh như ánh sáng của nó hiện nay là do các nhà khoa Machine Learning tính đã trở nên giỏi hơn theo thời gian trong việc hình dung ra các ứng dụng mới và hoàn thiện toán học trong các mô hình và thuật toán.
Để đánh giá cao những khả năng mà máy học mang lại, trước tiên chúng ta hãy cùng xem qua những thành tựu mà nó đã đạt được bằng cách xem xét lịch sử của máy học.
Nguồn gốc của Machine Learning
Giống như hầu hết các đột phá công nghệ và nền tảng máy tính, Machine Learning không thể được quy cho một cá nhân hoặc tổ chức duy nhất. Thay vào đó, nhiều người đã đóng góp vào sự phát triển và các ứng dụng kết quả của nó, và nhiều người khác nữa cũng sẽ làm như vậy trong tương lai.
Có cuộc tranh luận về việc ai đã phát minh ra nó và khi nào. Sự thật là có rất ít thứ phức tạp như thế này được tạo ra từ một tầm nhìn toàn diện, đơn lẻ thành một hình thức khả thi hoàn toàn mới đối với bối cảnh này. Thay vào đó, những người khác nhau làm việc để tạo ra các khía cạnh, thành phần, khái niệm, quy trình, mô hình và thuật toán khác nhau, cùng nhau tạo nên công nghệ được gọi là Machine Learning. Mỗi bước là một thành tựu đáng kinh ngạc, nhưng không còn nghi ngờ gì nữa, tổng thể mạnh mẽ hơn các bộ phận.
Tất nhiên, có những người nổi bật ngay cả trong nhóm những người làm nên lịch sử máy tính được kính trọng và tài năng, những người cùng nhau thổi trí thông minh vào những chiếc máy tính vô tri. Phần bên dưới nêu bật một số nhân vật đáng chú ý đóng vai trò quan trọng trong việc thúc đẩy máy học tại những thời điểm quan trọng trong lịch sử của nó.
Machine Learning được phát minh khi nào?
Bất chấp những cuộc tranh luận đang diễn ra, sự đồng thuận chung là máy học đã trở thành một thực thể được biết đến và do đó được Arthur Samuel, một nhà khoa Machine Learning tính làm việc tại IBM, chính thức phát minh vào năm 1952. Samuel đã đặt tên cho cách tiếp cận mới này đối với máy tính: máy học.
Machine Learning từng là bước đệm trên con đường phát triển AI, chặng đường dài hướng đến việc tạo ra AI tổng quát , hình thức mà các bộ phim khoa học viễn tưởng và chương trình truyền hình đã làm cho nổi tiếng và quen thuộc.
Tuy nhiên, Machine Learning có trọng tâm và khả năng hẹp hơn nhiều so với AI nói chung. Cuối cùng, người ta nhận ra rằng sẽ nhanh hơn và dễ hơn (mặc dù vẫn không dễ) khi phát triển Machine Learning thành các tải trọng tức thời và đa dạng hơn là chỉ hướng đến sự phát triển của AI.
Machine Learning có tập hợp con riêng của nó, được gọi là học sâu , thậm chí còn hẹp hơn ML vì nó chuyên biệt hơn nhiều. AI tổng quát là tập hợp con nhỏ hơn của AI tự nhận thức, một dạng thực sự mạnh mẽ nhưng hoàn toàn mang tính tương lai.
Một thông tin thú vị trong lịch sử về Machine Learning: Học sâu được phát minh vào năm 1943, chín năm trước khi Machine Learning xuất hiện. Có một số tranh luận về việc ai đã phát minh ra học sâu vì nó bắt nguồn từ mô hình của Walter Pitts và Warren McCulloch vào năm 1943. Nó không được biết đến rộng rãi với cái tên “học sâu” cho đến khi Gregory Hinton đổi tên nghiên cứu mạng nơ-ron thành biệt danh đó vào năm 2006.
Vào những năm 1970, Machine Learning đã phát triển thành một ngành riêng và hiện nay nó hỗ trợ phần lớn phần mềm trên thế giới. Trong một bước ngoặt trớ trêu trong lịch sử và bối cảnh của Machine Learning và AI, ngày nay nó thường được gắn nhãn là AI cho mục đích tiếp thị vì hầu hết người tiêu dùng không quen thuộc với thuật ngữ và khái niệm Machine Learning.
Ai là người phát minh ra máy học?
Người đầu tiên và có thể nói là được công chúng biết đến nhiều nhất trong lịch sử Machine Learning và AI là Alan Turing, người đã tạo ra Bài kiểm tra Turing để xác định xem máy móc có thực sự có thể suy nghĩ hay không. Nó đã trở thành một chuẩn mực nổi tiếng để đo lường xem một cỗ máy có đủ trí thông minh để không chỉ suy nghĩ như con người mà còn đánh lừa người ta tin rằng nó cũng là con người. Định nghĩa này đã tạo ra một số cách để bắt chước suy nghĩ của con người một cách nhân tạo và cũng để kiểm tra hiệu quả của suy nghĩ và hành động của nó.
Arthur Samuel đã nói ở trên, người đã đặt tên cho công nghệ thông minh này là máy học, cũng đã phát triển một chương trình dựa trên máy học để chơi cờ đam. Là một lưu ý thú vị trong lịch sử máy học và trí tuệ nhân tạo, nó được cho là trò chơi đầu tiên, hoặc ít nhất là một trong những trò chơi đầu tiên mà máy có thể chơi.
Trò chơi là một cách đơn giản để minh họa cách máy có thể học và phản ứng với hành động và phản ứng của con người. Nó học trò chơi thông qua thực hành – giống như con người – bằng cách sử dụng thuật toán minimax. Mặc dù đây là một sự phát triển sớm hơn trong lịch sử thuật toán Machine Learning, loại thuật toán này vẫn được sử dụng trong lý thuyết trò chơi và ra quyết định tự động để lựa chọn nước đi tiếp theo tối ưu cho người chơi hoặc người dùng.
Nhưng Frank Rosenblatt mới là người được ghi nhận là người đầu tiên thiết kế mạng nơ-ron cho máy tính. Đây là nỗ lực ban đầu nhằm mô phỏng các quá trình suy nghĩ của con người. Mặc dù là một tiến bộ vượt bậc, nhưng phải đến năm 1967, mới có người viết ra một thuật toán có thể nhận dạng các mẫu. Machine Learning về bản chất là một máy dò mẫu. Nó có thể nhanh chóng tìm ra các mẫu trong lượng dữ liệu khổng lồ, học hỏi từ các mẫu đó, rồi xác định kết quả dựa trên các mẫu mà nó tìm thấy.
Thật vô cùng khó để ghi nhận bất kỳ ai trong số những người này là nhà phát minh. Càng khó hơn khi bạn xem xét rằng đây chỉ là một số ít trong số rất nhiều người đã đóng góp vào sự đổi mới đáng kinh ngạc này.
Dòng thời gian về sự phát triển của máy học
Machine Learning lần đầu tiên được thực hiện khi con người phát hiện ra rằng các con số và vật thể có thể biểu diễn những thứ tồn tại trong thế giới thực. Đây là dữ liệu đầu tiên. Và Machine Learning học từ dữ liệu và cũng lấy dữ liệu từ đó.
Machine Learning dựa trên toán học và các mô hình của nó thường hoạt động với dữ liệu biểu diễn các thực thể hoặc hành động trong thế giới thực. Theo định nghĩa này, người ta có thể nói rằng Machine Learning trở nên khả thi ngay khi ai đó đếm một thứ gì đó và ghi lại số đó, có thể là bằng cách ghi chú có chủ đích trên tường hang động hoặc những viên sỏi trong túi.
Các phương pháp thu thập và lưu trữ dữ liệu tốt hơn đã xuất hiện, cũng như các máy móc có thể thực hiện các phép tính cần thiết. Năm 1642, một thiếu niên ở Pháp đã chế tạo ra máy tính cơ học đầu tiên. Lần đầu tiên, một cỗ máy chứ không phải con người thực hiện phép tính. Hệ nhị phân hiện đại đã được tạo ra.
Máy chơi cờ đầu tiên xuất hiện vào năm 1770 và ngay lập tức làm bối rối người châu Âu trong nhiều thập kỷ sau đó. Năm 1834, lập trình thẻ đục lỗ, được coi rộng rãi là “cha đẻ của máy tính”, đã được phát minh.
Một người phụ nữ đã tạo ra thuật toán đầu tiên vào năm 1842. Nhờ đó, Ada Lovelace đã trở thành lập trình viên máy tính đầu tiên trên thế giới. Công trình nghiên cứu về đại số của một nhà huyền môn đã giúp CPU trở nên khả thi nhưng phải hơn một thế kỷ sau, con người mới phát minh ra CPU.
Năm 1927, AI xuất hiện lần đầu trong phim ảnh. Nhưng Alan Turing không hình thành nên “Universal Machine” cho đến năm 1936, một lần nữa chứng minh rằng các nhà văn khoa học viễn tưởng có xu hướng tiên đoán hoặc ít nhất là sinh ra trước thời đại của họ.
Và cứ thế, lịch sử của máy học vẫn tiếp diễn, được xây dựng từng phần qua nhiều thế kỷ.
Gần đây, máy học được áp dụng cho nhiều loại dữ liệu khác nhau. Ví dụ, ngày nay đôi khi nó được ghép nối với các công nghệ khác như thị giác máy tính để nhận dạng các mẫu trong hình ảnh, từ chụp X-quang y tế đến nhận dạng khuôn mặt trong video. Các thuật toán hiện nay cũng hiểu được các truy vấn ngôn ngữ tự nhiên.
Sẽ thực tế hơn nhiều nếu tìm hiểu lịch sử Machine Learning từ những thứ có liên quan trực tiếp hơn và nằm ở đâu đó xa hơn trên dòng thời gian giữa các dạng dữ liệu đầu tiên và nhiều ứng dụng ngày nay.
Hầu hết mọi người sẽ chỉ ra sự xuất hiện của ý tưởng về mạng nơ-ron như một điểm khởi đầu tự nhiên cho câu chuyện về nguồn gốc của máy học. Vì vậy, từ thời điểm đó, dòng thời gian sau đây về quá trình tiến hóa của máy học cho đến trạng thái hiện tại của nó bắt đầu:
1943 – Ý tưởng về mạng nơ-ron nhân tạo xuất phát từ nghiên cứu về cách các nơ-ron trong não người hoạt động theo chức năng được mô tả vào thời điểm đó là “chủ nghĩa kết nối”. Đây là năm mà nhà sinh lý học thần kinh Warren McCulloch và nhà toán học Walter Pitts sử dụng các mạch điện đơn giản để sao chép hành vi của nơ-ron thông minh.
1949 – Một cuốn sách có tựa đề The Organization of Behavior được xuất bản. Đóng góp của nó nằm ở đề xuất rằng các đường dẫn thần kinh được tăng cường qua mỗi lần sử dụng. Điều này rất quan trọng để hiểu và định lượng các quá trình phức tạp trong não người.
1950 – Các nhà nghiên cứu bắt đầu cố gắng dịch các mạng lưới não bộ thành các hệ thống tính toán. Alan Turing cũng phát triển Bài kiểm tra Turing của mình cùng năm này, một bài kiểm tra sẽ trở thành chuẩn mực để đánh giá mức độ thông minh của máy móc.
1951 – Cỗ máy đầu tiên được xây dựng bằng mạng nơ-ron nhân tạo bởi Dean Edmonds và Marvin Minsky dựa trên mô hình của Hebb và gọi là máy SNARC.
1952 – Arthur Samuel gọi những quy trình điện toán mới sao chép suy nghĩ của con người này là: Machine Learning và sử dụng nó để phát triển một chương trình máy tính chơi cờ đam.
1954 – Mạng lưới Hebbian đầu tiên kết nối nền tảng tâm lý và thần kinh của việc học đã được triển khai thành công tại MIT.
1957 – Perceptron được Frank Rosenblatt phát minh, chủ yếu để nhận dạng hình ảnh, bằng cách sử dụng mô hình Hebb và các thuật toán Machine Learning ban đầu của Samuel.
1959 – Một mạng nơ-ron nhân tạo đã học cách làm cho các cuộc gọi điện thoại rõ ràng hơn, sử dụng các mô hình ADALINE và MADALINE của Stanford. ADALINE được phát triển để nhận dạng các mẫu nhị phân. Nó có thể dự đoán thành công bit tiếp theo trong khi đọc các bit phát trực tuyến từ đường dây điện thoại. MADALINE đã sử dụng bộ lọc thích ứng để loại bỏ tiếng vang trên đường dây điện thoại và là mạng nơ-ron đầu tiên được sử dụng để giải quyết một vấn đề thực tế. Cả hai vẫn đang được sử dụng cho đến ngày nay.
1968 – Bộ phim 2001: A Space Odyssey của Stanley Kubrick đã thúc đẩy mạnh mẽ khái niệm AI nói chung và AI có khả năng tự nhận thức.
1975 – Mạng nhiều lớp và không giám sát đầu tiên được phát triển.
1979 – Xe đẩy Stanford được phát minh để giải quyết vấn đề lái xe tự hành trên mặt trăng từ trái đất. Người phát triển xe, một sinh viên tốt nghiệp Stanford, đã sử dụng máy ảnh và điều khiển từ xa để điều khiển xe quanh một căn phòng đầy chướng ngại vật, phần lớn là ghế.
1981 – Khái niệm Học tập dựa trên giải thích (EBL) được Gerald Dejong giới thiệu. Nó tương đương với việc sử dụng ML để phân tích dữ liệu đào tạo để tự tạo ra một quy tắc chung nhằm xác định và loại bỏ dữ liệu không quan trọng hoặc không liên quan. Hãy nghĩ về nó như là tự làm sạch.
1982 – Các bộ phim lại thúc đẩy kỳ vọng của công chúng về ML và AI lần nữa, lần này dưới dạng các bản sao trong Blade Runner. Các nhà khoa học hiện đang được thông báo rằng công chúng không chỉ mong đợi phần mềm thông minh bắt chước bộ não con người, mà còn mong đợi cơ thể bao bọc và huy động chúng sao chép chặt chẽ cơ thể con người với siêu năng lực.
1985 – Một mạng lưới thần kinh có tên NETtalk đã tự học cách phát âm đúng các từ mới với tốc độ 20.000 từ mới mỗi tuần. Ban đầu, nó nói tiếng vô nghĩa khi cố gắng học nói nhưng nó tiếp tục học cho đến khi có thể phát âm các từ mới gần như không tốn chút công sức nào.
1997 – Cỗ máy Deep Blue của IBM đã đánh bại đại kiện tướng cờ vua Garry Kasparov.
1999 – Trạm làm việc thông minh CAD của Đại học Chicago đã phân tích 22.000 ảnh chụp nhũ ảnh và chứng minh độ chính xác cao hơn 52% trong chẩn đoán ung thư so với các bác sĩ X-quang.
2006 – Gregory Hinton đổi tên nghiên cứu mạng nơ-ron thành “học sâu”. Ngày nay, các công ty Internet lớn sử dụng các kỹ thuật của ông để cải thiện các công cụ như gắn thẻ hình ảnh và nhận dạng giọng nói.
2009 – Netflix tìm cách cải thiện các đề xuất phim và chương trình truyền hình cho khách hàng bằng cách trao giải thưởng trị giá 1 triệu đô la cho bất kỳ ai có thể vượt qua thuật toán của họ trong xếp hạng phim của người tiêu dùng. Nhóm các nhà khoa học AT&T của BellKor đã mang về giải thưởng lớn, nhưng chỉ hơn một chút. Họ chỉ hơn những người chiến thắng ở vị trí thứ hai vài phút.
2010 – Kinect của Microsoft theo dõi 20 đặc điểm của con người với tốc độ 30 lần mỗi giây, cho phép trò chơi và máy tính đầu tiên điều khiển thông qua chuyển động và cử chỉ.
2011 – Watson của IBM đã thắng trò chơi Jeopardy bằng cách đánh bại hai đối thủ là con người. Nó hơi vấp ngã một chút nhưng vẫn thắng.
2012 – Một trong những mạng nơ-ron của Google đã tự học cách nhận dạng mèo và người trong các video trên YouTube. Nó không chính xác 100 phần trăm nhưng điểm số vẫn rất chính xác đối với một cỗ máy tự học. Nó phát hiện mèo chính xác 74,8 phần trăm thời gian và khuôn mặt người với độ chính xác 81,47 phần trăm.
2013 – Boston Dynamics đã tạo ra Atlas, một robot hình người. Trước đó, cùng công ty này đã tạo ra BigDog, một robot bốn chân giống chó.
2014 – Eugene Goostman đã thành công khi tự nhận mình là một thiếu niên người Ukraine trước 33 phần trăm giám khảo là con người, trở thành cỗ máy thông minh đầu tiên vượt qua bài kiểm tra Turing (khoảng 60 năm sau khi Alan Turing qua đời). Goostman là một chatbot.
Đây là năm công nghệ sức khỏe bắt đầu sử dụng máy học một cách nghiêm túc để cải thiện kết quả của bệnh nhân. Một trong những ứng dụng đầu tiên dự đoán thời gian chờ ER từ mô phỏng sự kiện dựa trên các điểm dữ liệu như mức độ nhân sự, tiền sử bệnh tật, tình trạng bệnh tật (ví dụ, thời kỳ bùng phát như mùa cúm hoặc một ngày hè bình thường không có bùng phát) và cách bố trí bệnh viện.
Đây cũng là năm Facebook phát triển DeepFace để nhận dạng khuôn mặt.
2015 – AlphaGo của Google đã giành chiến thắng trong trò chơi cờ bàn khó nhất thế giới có tên là Cờ vây. Điều này có nghĩa là máy móc đã đánh bại con người ở mọi trò chơi cờ bàn. Việc đưa máy móc đấu với con người trong các trò chơi không còn là điều mới lạ (hay thể thao) nữa.
Đây cũng là năm Amazon ra mắt nền tảng máy học của riêng mình và Microsoft đã tạo ra Bộ công cụ máy học phân tán.
Và đó là năm Tesla ra mắt Autopilot, một tính năng bán tự động cho chế độ lái rảnh tay trên xe ô tô tiêu dùng. Autopilot được cung cấp dưới dạng bản cập nhật phần mềm duy nhất cho chủ sở hữu Model S chỉ sau một đêm.
2016 – HAL ra đời. Thực ra thì không hẳn vậy. Nhưng một hệ thống AI có tên là LipNet đã đọc được khẩu hình miệng với độ chính xác 93,4 phần trăm, ngang bằng với cỗ máy hư cấu có tên là HAL trong bộ phim nổi tiếng năm 1968, 2001: A Space Odyssey.
Đây cũng là năm mà xử lý ngôn ngữ tự nhiên ra mắt trong thế giới thực. Một nhà bán lẻ có tên The North Face đã sử dụng xử lý ngôn ngữ tự nhiên Watson của IBM trong chatbot mua sắm cá nhân trên ứng dụng di động của mình.
Đây cũng là năm Google Assistant, một trợ lý ảo hỗ trợ AI, ra đời.
2017 – Nhóm Jigsaw của Alphabet đã xây dựng một hệ thống ML để tự động hóa việc bắt giữ những kẻ phá hoại cho các công ty không có đủ nguồn lực hoặc ý chí để kiểm duyệt các bình luận trên trang web.
2019 – Google AI đã giành chiến thắng trong việc chẩn đoán chính xác bệnh ung thư phổi.
2020 – Machine Learning, học sâu và AI đã được soạn thảo và đưa ra tuyến đầu trong cuộc chiến chống lại đại dịch COVID-19.
2021 – Một con tàu không người lái, được điều khiển bằng AI có tên là Dự án Mayflower sẽ giương buồm băng qua Đại Tây Dương.
Phần kết luận
Ngày nay, có nhiều công cụ và khuôn khổ mã nguồn mở có sẵn mà bạn có thể sử dụng để cung cấp năng lượng cho các ứng dụng Machine Learning. PyTorch là một khuôn khổ Machine Learning dựa trên Python sử dụng CPU và GPU để tăng tốc hiệu suất xử lý của nó. Bạn có thể cài đặt PyTorch trên máy chủ Linode Ubuntu 20.04 và sử dụng GPU hoặc các phiên bản tính toán CPU chuyên dụng .