Image

Tác giả

Nguyễn Hương Anh

Năm xuất bản

18/05/2021

Chuyên mục

Tài liệu Fintech

Mô tả

1. Tại sao phải biết về dữ liệu thay thế?

Những năm gần đây, lượng dữ liệu mà con người tạo ra, thu thập và xử lý đã tăng trưởng với tốc độ chưa từng có. Lượng dữ liệu mới được tạo ra không chỉ tăng về quy mô mà tốc độ gia tăng cũng tiếp tục được nhân lên dựa trên sự phát triển nhanh chóng của các thiết bị kỹ thuật số. Trong xu hướng đó thì dữ liệu thay thế (alternative data) cũng là một khái niệm mới ra đời nhưng đã nhanh chóng trở nên phổ biến. Người ta sử dụng dữ liệu thay thế trong rất nhiều lĩnh vực từ đó tạo nên sự đột phá về hiệu quả, an toàn và tiện dụng … trong rất nhiều hoạt động cụ thể. Ví dụ như: phân tích những thông tin thu thập từ hành vi tiêu dùng của khách hàng giúp cho các nhà bán lẻ cải thiện chất lượng sản phẩm và các kênh cung ứng phù hợp; phân tích thói quen ăn uống, vận động, làm việc và nghỉ ngơi của mỗi cá nhân giúp cho các chuẩn đoán y khoa trở nên chính xác và hiệu quả hơn.

2. Dữ liệu thay thế là gì

Cho đến nay, vẫn chưa có một định nghĩa thống nhất được công nhận trên toàn thế giới về dữ liệu thay thế. Cục bảo vệ tài chính tiêu dùng của Mỹ (CFPB) định nghĩa dữ liệu thay thế là dữ liệu không phải “dữ liệu truyền thống”, nghĩa là đồng nhất dữ liệu thay thế với cụm từ “dữ liệu phi truyền thống”. Khái niệm này nhấn mạnh vào tính chất mới của loại dữ liệu thay thế chứ chưa nêu được đặc trưng của dữ liệu này (phi truyền thống- hay là trước đây chưa từng được sử dụng).

Một số tổ chức đã đưa ra những khái niệm khác nhằm mô tả cụ thể hơn đặc tính của dữ liệu thay thế. Chẳng hạn: Tổ chức đối tác toàn cầu về tài chính toàn diện (GPFI) đã đề cập dữ liệu thay thế là một “thuật ngữ chung chỉ khối lượng dữ liệu khổng lồ được tạo ra bằng cách sử dụng ngày càng nhiều các công cụ kỹ thuật số và hệ thống thông tin”. Hội đồng quốc tế về báo cáo tín dụng (International committe on Credit reporting-ICCR) định nghĩa dữ liệu thay thế là “những thông tin có sẵn ở dạng số hoá được thu thập thông qua các nền tảng công nghệ/ điện tử” (Guidance Note: Use of Alternative Data to Enhance Credit Reporting to Enable Access to Digital Financial Services by Individuals and SMEs Operating in the Informal Economy, ICCR, 2018)

Tiếp cận từ hoạt động chấm điểm và xếp hạng tín dụng Nguyễn Thị Hiền (2019) cho rằng dữ liệu thay thế là “tất cả các dữ liệu có thể sử dụng để đánh giá hành vi trả nợ của khách hàng mà chưa được sử dụng trong các báo cáo tín dụng truyền thống”. Nó được hiểu là dữ liệu cung cấp thông tin thanh toán tài chính bổ sung về khách hàng và những thông tin này có tính năng dự đoán về khách hàng đó.

Bảng 1 trình bày một số loại dữ liệu truyền thống và dữ liệu thay thế trong hoạt động chấm điểm tín dụng khách hàng của FICO. Hình 1 trình bày 24 loại dữ liệu thay thế, được xác định bằng phương pháp thu thập hoặc bản chất của dữ liệu Eagle Alpha. Đây là hai công ty chuyên phân tích dữ liệu thay thế cung cấp cho các doanh nghiệp, tổ chức, giúp họ hiểu về khách hàng của mình.

Bảng 1: Một số loại dữ liệu truyền thống và dữ liệu thay thế trong chấm điểm tín dụng

Dữ liệu truyền thống

Dữ liệu thay thế

Dữ liệu hồ sơ đề nghị cấp tín dụng

Dữ liệu chuẩn

Dữ liệu từ trung tâm thông tin tín dụng

Dữ liệu lịch sử giao dịch của khách hàng

Dữ liệu thanh toán các dịch vụ/ hàng hoá tiện ích

Dữ liệu hồ sơ xã hội

Dữ liệu mạng xã hội; lịch sử sử dụng web; dữ liệu audio, text

Dữ liệu từ bảng hỏi

Dữ liệu từ di động

(Nguồn: FICO blog (29/8/2017), Using alternative data in credit modeling)

Hình 1. 24 loại dữ liệu thay thế của Eagle Alpha

(nguồn: Eagle Alpha, 2020)

  1. Dữ liệu thay thế khác gì dữ liệu truyền thống?

Theo Tổ chức đối tác toàn cầu về tài chính toàn diện (GPFI), dữ liệu truyền thống là loại dữ liệu có cấu trúc, nghĩa là dạng dữ liệu được tổ chức và phân loại theo cấu trúc xác định. Dữ liệu truyền thống được thu thập và xử lý bằng các công cụ, phần mềm truyền thống chẳng hạn như Microsoft Excel. Khi khai thác dữ liệu truyền thống thường phải trả lời các câu hỏi: Dữ liệu lấy ra kiểu gì? định dạng dữ liệu như thế nào? Trong khi đó, dữ liệu thay thế bao gồm dữ liệu có cấu trúc và không có cấu trúc. Khi khai thác và phân tích dữ liệu thay thế, người sử dụng không cần quan tâm đến kiểu dữ liệu và định dạng của chúng; điều quan tâm là giá trị mà dữ liệu mang lại có đáp ứng được cho công việc hiện tại và tương lai hay không. Do đó, việc thu thập xử lý dữ liệu thay thế đòi hỏi phải có những ứng dụng công nghệ thông tin hiện đại và đặc trưng.

Ngoài ra, dữ liệu thay thế có những đặc trưng khác biệt so với dữ liệu truyền thống đó là:

- Tính mới: dữ liệu thay thế là dữ liệu chưa từng được sử dụng trong quá khứ. Tuy nhiên tính mới của một loại dữ liệu là không đồng nhất trong lĩnh vực khác nhau. Một cơ sở dữ liệu có thể là truyền thống đối với một ngành nhưng lại là mới đối với ngành khác. Ví dụ dữ liệu từ khách hàng tiêu dùng điện là loại dữ liệu truyền thống trong ngành điện lực nhưng lại là dữ liệu mới nếu được ứng dụng vào chấm điểm và xếp hạng tín dụng cho khách hàng. Bởi vậy tính mới của dữ liệu cần được xem xét trên cơ sở của từng lĩnh vực cụ thể. Sự khác biệt về trình độ phát triển ở các thị trường khác nhau cũng có thể làm cho một loại dữ liệu là mới ở thị trường này nhưng không mới ở thị trường khác.

- Tính lớn: đặc tính này phản ánh quy mô của lượng dữ liệu được tạo ra, thu thập và phân tích sử dụng. Tính lớn thể hiện trên các khía cạnh như số lượng bản ghi và quan sát, số trường dữ liệu trên mỗi bản ghi. Điều này cho thấy dữ liệu thay thế có khả năng bao phủ một lượng lớn quan sát, đồng thời với một số lượng lớn trường dữ liệu cho phép khai thác để cung cấp nhiều thông tin trên nhiều khía cạnh khác nhau về cùng một chủ thể. Chính vì vậy, các thông tin thu thập được thông qua quá trình xử lý dữ liệu thay thế thường là phong phú hơn và phản ánh đầy đủ hơn về đối tượng. Dữ liệu thay thế được cập nhật liên tục, trong khi đó kho dữ liệu truyền thống thì lâu lâu mới được cập nhật và trong tình trạng không theo dõi thường xuyên, gây ra tình trạng lỗi cấu trúc truy vấn dẫn đến không tìm kiếm được thông tin đáp ứng theo yêu cầu.

- Gắn với các nền tảng kỹ thuật số: đặc tính này phản ánh việc dữ liệu phát sinh, thu thập và phân tích gắn liền với sự phát triển của nền tảng kỹ thuật số. Lưu trữ dữ liệu truyền thống vô cùng phức tạp và luôn đặt ra câu hỏi lưu thế nào: dung lượng kho lưu trữ bao nhiêu là đủ? gắn kèm với câu hỏi đó thì chi phí đầu tư sẽ là rất lớn. Công nghệ lưu trữ dữ liệu thay thế đã phần nào có thể giải quyết được vấn đề trên nhờ những công nghệ lưu trữ đám mây, phân phối lưu trữ dữ liệu phân tán và có thể kết hợp các dữ liệu phân tán lại với nhau một cách chính xác và xử lý nhanh. Vì vậy, cũng thường thấy rằng ở những nơi có nền tảng kỹ thuật số phát triển tốt thì việc sử dụng dữ liệu thay thế thường đạt được mức độ phát triển cao hơn.

Bảng 2: Sự khác nhau giữa dữ liệu thay thế và dữ liệu truyền thống

 

Dữ liệu thay thế

Dữ liệu truyền thống

Giải thích

Quy mô dữ liệu

Mới được hình thành

Thường xuyên cập nhật

Liên quan đến nhiều khía cạnh

Có lịch sử hình thành dài

Ít được cập nhật

Đề cập đến ít khía cạnh

Một lượng lớn dữ liệu được cập nhật thường xuyên dẫn đến cho nhiều thông tin hơn cho quá trình phân tích. VIệc cập nhật thường xuyên có nghĩa là nhà quản lý có thể thực hiện việc phân tích nhanh chóng, tăng cường số lượng danh mục phân tích

Độ sâu của dữ liệu

Đề cập đến nhiều khía cạnh

Khai thác nhiều nội dung sâu để có thể thực hiện phân lớp tốt hơn

Ít khía cạnh

Chỉ cung cấp những thông tin cơ bản, thường là liên quan trực tiếp đến nội dung phân tích

Dữ liệu mới cung cấp thông tin trên nhiều lĩnh vực hơn dẫn tới việc dự đoán xu hướng và diễn biến tốt hơn

Phát hiện các mối quan hệ tiềm ẩn, có thể giúp thực hiện được nhiều chiến lược đầu tư hơn

Lợi thế cạnh tranh

Đòi hỏi khả năng đầu tư và lượng dữ liệu lớn

Thường sẵn có

Công việc phân tích có thể được thực hiện khác dễ dàng

Cần phải có các kỹ năng và công nghệ mới để có thể khai thác các lợi thế từ dữ liệu thay thế

(Nguồn: Standard Media Index (SMI), 2019)

 

admin_img

Người đăng

Nguyễn Hương Anh

ThS. Hương Anh tốt nghiệp loại Xuất sắc Đại học Kinh tế Quốc dân năm 2018. Trong quá trình học, ThS. Hương Anh đạt nhiều học bổng khuyến khích sinh viên có thành tích xuất sắc. Sau khi tốt nghiệp Đại học, ThS. Hương Anh tiếp tục học Thạc sĩ Kinh doanh Quốc tế tại University of Lincoln (Vương quốc Anh) và đạt học bổng Quốc tế 50% cũng như tốt nghiệp loại Xuất sắc.

Bình luận

Hãy để lại bình luận của bạn tại đây!

Để lại bình luận

img

Đăng ký nhận bản tin