Big data - một thuật ngữ chuyên môn đang được đề cập khá nhiều trong thời gian gần đây, đặc biệt khi thế giới đang chuyển dịch từ công nghiệp 3.0 sang 4.0. Nền tảng phát triển công nghệ thông tin, xử lý dữ liệu, thông tin liên lạc, công nghệ quan sát và một số ngành khác liên quan trong giai đoạn công nghiệp thông tin.

Trong khi đó, thành phố đang triển khai xây dựng TP HCM trở thành đô thị thông minh. Việc triển khai kho dữ liệu dùng chung và phát triển hệ sinh thái dữ liệu mở là nền tảng quan trọng cung cấp thông tin dữ liệu để có thể vận hành, quản trị đô thị.

Trong đó, với lực lượng dân số trẻ, khả năng nắm bắt công nghệ nhanh, Việt Nam được đánh giá là thị trường big data tiềm năng hàng đầu Châu Á. Tuy nhiên, mức độ am hiểu và vận dụng công nghệ này của doanh nghiệp Việt hiện còn chập chững, mơ hồ. Để khắc phục tình trạng này, TP HCM đang tập hợp cơ sở dữ liệu để hoàn thiện Trung tâm dữ liệu mở phục vụ cho thành phố, doanh nghiệp và người dân.

Theo TS. Vũ Tường Thụy - Giảng viên Đại học Nottingham cơ sở tại Malaysia, việc xây dựng nguồn dữ liệu mở là việc cấp thiết, tạo điều kiện cho các đối tượng trong xã hội được khai thác và đóng góp để phát triển.

Ví dụ, với giải pháp thông minh cảnh báo sự cố giao thông dựa trên dữ liệu GPS từ thiết bị giám sát hành trình được thử nghiệm, cơ quan quản lý vẫn nắm được mật độ lưu thông ở từng địa điểm trong từng thời khắc để giải quyết ùn tắc ngay khi nó bắt đầu.

Tuy nhiên, vấn đề đặt ra hiện nay là nguồn dữ liệu kinh tế- xã hội của TP HCM đang nằm rải rác ở khắp các sở, ngành, quận, huyện. Mỗi cơ quan này lại có cách lưu trữ, xử lý và quản lý dữ liệu khác nhau.

Để khắc phục khó khăn này, thành phố đã đặt ra kế hoạch xây dựng kho dữ liệu dùng chung và phát triển hệ sinh thái dữ liệu mở trong 2 năm. Cụ thể, thành phố sẽ tích hợp các cơ sở dữ liệu hiện có về trung tâm dữ liệu của thành phố, sau đó sẽ xây dựng kho dữ liệu dùng chung, triển khai các nền tảng phục vụ kho dữ liệu dùng chung của thành phố và các ứng dụng báo cáo phân tích chuyên sâu.

Về nguồn lực để thực hiện kế hoạch, thành phố sẽ chú trọng huy động các nguồn lực ngoài nguồn ngân sách, khuyến khích doanh nghiệp đầu tư cho thuê các dịch vụ công nghệ thông tin nhằm triển khai nhanh, hiệu quả các ứng dụng công nghệ thông tin.

Theo TS. Vũ Tường Thụy, Việt Nam cần xây dựng một chương trình khung nhất quán cấp nhà nước, cho phép các thành phần cùng phát triển, khai thác và chia sẻ nguồn lực. Đồng thời đẩy mạnh các chương trình đào tạo về khoa học dữ liệu, phát triển và triển khai các chuẩn dữ liệu, đồng bộ hệ thống dữ liệu thông tin địa lý nền, mở cơ sở dữ liệu cho phép chia sẻ và đóng góp. Đặc biệt, bản đồ nền là rất cần thiết cho các kế hoạch xây dựng thành phố thông minh.

Trước mắt, thành phố sẽ xây dựng kho dữ liệu dùng chung và phát triển hệ sinh thái dữ liệu mở nhằm giúp người dân, doanh nghiệp có dữ liệu phục vụ cho hoạt động sản xuất kinh doanh của mình, đặc biệt kho dữ liệu mở sẽ hỗ trợ cho các hoạt động khởi nghiệp. Dự kiến đến cuối năm 2018 sẽ công bố hệ sinh thái dữ liệu mở hoàn chỉnh.

Trong kho dữ liệu mở sẽ có một số dữ liệu miễn phí hoàn toàn, một số dữ liệu có thu phí để có nguồn duy trì vận hành kho dữ liệu. Dạng dữ liệu có thu phí gồm dữ liệu doanh nghiệp dùng để phục vụ cho quá trình kinh doanh của mình.