Bản in
Khoa học thời kỳ chuyển đổi số
Tại hội nghị Cơ học toàn quốc vào tháng 12/2017, giáo sư Hồ Tú Bảo (Viện KH&CN Tiên tiến Nhật Bản) cho rằng, cuộc cách mạng công nghiệp lần thứ 4 (CMCN4) là cuộc cách mạng về số hóa. Vì thế, để tận dụng được những thế mạnh của CMCN4, mọi lĩnh vực KH&CN đều cần phải gắn với dữ liệu nhiều hơn và do đó, và cần phải chuyển mình theo phương thức mới.

 Tại sao lại cần phải số hóa? Điều đó có bắt buộc không?

Trước hết, có thể thấy tất cả các vật thể tồn tại ở trạng thái vật lý nếu muốn đưa vào trong máy tính để tính toán hoặc lưu trữ dữ liệu thì đều phải chuyển sang thể hiện dưới dạng con số 0 và 1. Đó là dạng đầu tiên và đơn giản của số hóa từ khi có máy tính và chúng ta gọi đó là phiên bản số của các thực thể có thật. Vậy làm ra các phiên bản số của các thực thể ở trạng thái vật lý này để làm gì? Chúng ta hãy nhìn vào những ví dụ rất cụ thể đã được thực hiện trong ngành sản xuất ô tô tự lái. Cơ sở ban đầu của nó là những chiếc ô tô chạy xăng bình thường, sau đó người ta chuyển đổi nó sang phiên bản số với việc sao lưu các dữ liệu, thu thập thông tin về nó trong các trạng thái tĩnh, động... Nhờ vậy, họ mới có thể làm ra được những chiếc ô tô tự lái được.

Một số xu hướng khác của số hóa cũng được phát triển trên thế giới trong thời gian qua, ví dụ như xây dựng bệnh án điện tử từ những bệnh án giấy để giúp các thầy thuốc có được phác đồ điều trị chuẩn xác trong thời gian ngắn nhất, hay việc số hóa dòng sông từ những dữ liệu về dòng chảy, lưu lượng nước trong từng mùa, đặc điểm địa hình, hiện tượng bồi lắng… để có phương án kiểm soát dòng sông hợp lý.

Qua một vài ví dụ, chúng ta có thể thấy tất cả những vật trong thế giới thật đều có thể có những phiên bản số đang nằm ở đâu đấy, như trong máy tính, trên mạng internet. Việc kết nối phiên bản thật và phiên bản số sẽ dẫn đến một điều rất cơ bản là mọi hành động trên thế giới thực của chúng ta đều có thể được tính toán và điều khiển hoạt động trên không gian số, do đó, dẫn đến sự ra đời của nền kinh tế số. Đây cũng chính là điều cốt lõi của CMCN4.

Nhìn lại quá khứ, chúng ta thấy một điều thú vị: sự xuất hiện của internet dẫn đến sản xuất hàng loạt và sau đó dẫn đến sản xuất tự động còn bây giờ, khi bắt đầu có sản xuất trên không gian số, nó dẫn đến quá trình sản xuất thông minh, tức là có thể làm ra những sản phẩm riêng biệt, đáp ứng yêu cầu riêng biệt của từng khách hàng.

Sản xuất số và các ngành khoa học máy tính

Để xây dựng được quy trình sản xuất thông minh, chúng ta phải nhắc đến sự đóng góp của trí tuệ nhân tạo (AI), lĩnh vực phát triển được 60 năm qua kể từ khi có máy tính. Về cơ bản, trí tuệ nhân tạo làm cho máy móc nói chung có trí tuệ như của con người như biết lập luận, hiểu được ngôn ngữ, biết học tập… Vài năm trở lại đây, chúng ta biết đến những đột phá của trí tuệ nhân tạo thông qua những sản phẩm tiêu biểu như các hệ AlphaGo, AlphaZero, việc máy tính có thể nhận dạng tiếng nói để chuyển thành văn bản… hoặc các thiết bị tham gia chẩn đoán bệnh ung thư, sản xuất những chiếc ô tô tự lái…

Những tiến bộ này của trí tuệ nhân tạo đều dựa trên lĩnh vực học máy (machine learning), vốn có lịch sử phát triển trong rất nhiều năm, và là “giao điểm của khoa học máy tính, thống kê và nhiều lĩnh vực khác liên quan đến việc tự động hoá các hệ thống tự hoàn thiện theo thời gian, suy diễn và ra quyết định trong điều kiện bất định.” (M.I. Jordan and T. Mitchell, “Machine Learning: Trends, perspectives, and prospects”, Science, 17 July 2015). Có thể hình dung đến ngành học máy như một cỗ máy mà đầu vào có rất nhiều dữ liệu khác nhau và sản phẩm đầu ra là có những thứ người ta mong muốn như những chẩn đoán, kết luận… trong y học. Đi từ cá thể đến tổng quát, học máy đã dẫn đến những thay đổi cốt lõi của ngành trí tuệ nhân tạo, qua đó đến công nghệ số hiện nay.

Một lĩnh vực khác cũng được coi là một phần cốt lõi của công nghệ số, đó là khoa học dữ liệu (data science). Tương tự như học máy, khoa học dữ liệu là sự giao thoa của rất nhiều lĩnh vực liên quan khi kết hợp được toán học, thống kê toán học và khoa học máy tính, trong đó đặc biệt là ngành học máy… Trên thế giới, hiện tại người ta coi khoa học dữ liệu là lĩnh vực có sức ảnh hưởng rất lớn trong tương lai. Giáo sư W.E. Deming của trường Đại học Stanford (Mỹ) đã nói một cách hình ảnh về vai trò của dữ liệu: “Ta tin Thượng đế. Ngoài ra, là dữ liệu”.

Các đột phá trong ngành công nghệ thông tin dẫn đến CMCN4 như IoT (internet of thing), trí tuệ nhân tạo, điện toán đám mây (computing cloud), dữ liệu lớn (big data)... cùng góp phần tạo ra dữ liệu và giúp máy thực hiện các hành động theo quyết định đã được lập trình. Trong quá trình này, khoa học dữ liệu đóng vai trò “bộ não” và thực hiện việc phân tích dữ liệu để hỗ trợ đưa ra quyết định. Chúng ta có thể hình dung về những đột phá ấy một cách sống động thông qua một hệ thống phức tạp là cơ thể con người: các kỹ thuật công nghệ thông tin kết nối với nhau bằng thần kinh, mạch máu như IoT – sensor, sau đó trí tuệ nhân tạo thực thi quyết định điều khiển dựa trên việc phân tích dữ liệu của khoa học dữ liệu.

Vài năm trước có cuộc tranh luận rất lớn trong ngành công nghệ thông tin ở Mỹ. Ông Moshe Y. Vardi, giáo sư ngành Khoa học máy tính (Đại học Rice, Mỹ) trong bài viết trên tạp chí Communications of the ACM của Hội Nghiên cứu, giáo dục ngành Khoa học máy tính và Tin học quốc tế (ACM) cho rằng, khoa học chỉ có hai chân thôi, đó là lý thuyết và thực nghiệm. Tuy nhiên sau đó ông lại đưa ra nhận định “Khoa học mới có thêm những cái chân mới”, hàm ý việc khoa học ngày nay có thêm sự tham gia của khoa học tính toán (Computational Science) và khoa học dữ liệu (Data Intensive Science).

Những gợi ý cho Việt Nam

Trên thế giới, người ta đã bắt đầu áp dụng rất nhiều công nghệ số vào quá trình quản trị cũng như quá trình sản xuất để làm ra những sản phẩm tiên tiến như thành phố thông minh, robot, xe tự lái, xe bay…

Ví dụ như với lĩnh vực giao thông, chúng ta đều biết, số lượng xe hơi, xe tải ở mỗi thành phố đều rất lớn và mỗi một chiếc xe đều có rất nhiều thông tin về hành trình trong ngày. Vấn đề đặt ra là làm sao quản lý được lượng dữ liệu lớn như vậy và trích rút được những thông tin ấy để phục vụ công tác quản lý, giám sát như giám sát hành trình, giải quyết các bài toán vận chuyển sao cho tránh ùn tắc giao thông, tránh di chuyển qua những tuyến đường có lưu lượng phương tiện đi lại lớn trong giờ cao điểm, giảm tai nạn giao thông, tiết kiệm xăng dầu, tiết kiệm thời gian di chuyển mà vẫn đạt hiệu quả về việc chở hàng hóa…, nhờ đó gắn kết chặt chẽ hơn giao thông với phát triển kinh tế mà việc vận chuyển sản phẩm là một mắt xích quan trọng của logistics. Đây là những bài toán hoàn toàn có thể giải quyết được nếu dựa trên thế mạnh của dữ liệu và công nghệ số.
Với ngành thủy lợi, nhiều nhà nghiên cứu nước ngoài, ví dụ như ở Đức, đã có thể dự báo lũ lụt vùng sông Rhine giữa Andernach và Duesseldort. Để có được những kịch bản dự báo lũ lụt, họ đã sử dụng những mô hình về lượng mưa (Rainfall-runoff Model) mô hình thủy lực (Hydraulic Model), mô hình vận chuyển nước (Water Transport Model) và áp dụng số liệu đo đạc, tính toán về dòng sông Rhine theo nhiều thời kỳ mùa lũ, mùa khô... Công nghệ số có thể giúp chúng ta kết hợp được các nguồn dữ liệu, gắn với dữ liệu thực tế đó với các mô hình mô phỏng để khái quát nó lên và làm cho mô hình đó gần với thực tế hơn, từ đó chúng ta có thể dự báo được lũ lụt trên sông mùa lũ, giúp các nhà máy thủy điện, hồ đập... có thể chủ động ứng phó và xác định được thời điểm thích hợp để xả lũ, tránh xảy ra ngập úng ở hạ nguồn. Để có được những dự báo gần chính xác nhất, chúng ta cầnkết hợp mô hình thuỷ lực với dữ liệu quan sát (ảnh vệ tinh và các nguồn viễn thám, đo đạc trên cơ sở đồng hoá dữ liệu (data assimilation). Mặc dù đây là công việc khó nhưng chúng ta vẫn có thể làm được nếu quyết tâm làm và làm thật bài bản.

Có thể khẳng định, việc số hóa đang diễn ra sôi động trên thế giới và đó là bản chất của CMCN 4. Do vậy nếu chúng ta thực sự muốn “nhập cuộc” vào CMCN4 thì phải có dữ liệu. Nhưng trên thực tế, thứ chúng ta đang thiếu là dữ liệu và số ít dữ liệu mà chúng ta có không chỉ được xây dựng một cách thiếu hệ thống mà còn không liên kết được với nhau. Hằng ngày chúng ta đang có thêm nhiều dữ liệu, nếu dữ liệu không được tổ chức tốt và hệ thống hóa những dữ liệu mà chúng ta đang có trong nhiều lĩnh vực của đời sống xã hội, sản xuất, tiêu dùng… thì khi bắt tay vào chuẩn bị cho CMCN 4, chúng ta sẽ không có cơ sở để thực hiện việc chuyển đổi phương thức sản xuất. Chúng ta biết rằng, việc làm ra sản phẩm tiêu dùng trong lịch sử phát triển của con người trong thời cơ khí thì sản xuất đơn lẻ, khi tới thời tự động hóa là sản xuất hàng loạt nhưng đến thời CMCN 4 – tức là sản xuất thông minh, người ta cũng tiến tới sản xuất sản phẩm cho từng cá thể như trong y tế chính xác (precision medicine). Nếu không có dữ liệu và phân tích dữ liệu, chúng ta sẽ nằm ngoài cuộc chơi này.

Năm 2017, chúng ta đã nói rất nhiều về CMCN 4, vì thế trong thời gian tới, chúng ta cần hành động nhiều hơn. Mọi KH&CN trong thời kỳ KH&CN đều cần phải gắn với dữ liệu nhiều hơn và cần phải chuyển mình để phát triển.
 
Bốn đột phá của ngành công nghệ thông tin dẫn đến CMCN4 tính toán đám mây (computing cloud) lưu trữ dữ liệu và tính toán dữ liệu dưới dạng dữ liệu, bản chất của tính toán đám mây là không lưu trữ dữ liệu trong máy tính mà trong các chương trình dữ liệu ở đâu đấy (có thể là dịch vụ lưu trữ); trí tuệ nhân tạo: đem lại các chức năng thông minh hơn, chúng ta có thể phát triển được do những đột phá của ngành học máy; dữ liệu lớn (big data): rất lớn và phức tạp và hiện nay chúng ta có rất nhiều dữ liệu hơn so với trước đây; IoT: thu thập và chuyển đổi dữ liệu.