You are on page 1of 7

Tại sao các sáng kiến phân tích dữ liệu vẫn không thành

công
Phân tích dữ liệu hiệu quả là một yêu cầu của kinh doanh kỹ thuật số -
và tất cả bắt đầu với các thực hành quản trị dữ liệu thông minh và
nhấn mạnh vào chất lượng và ngữ cảnh.

Các giám đốc điều hành nói về giá trị của dữ liệu nói chung, nhưng
Michele Koch, giám đốc tình báo dữ liệu doanh nghiệp tại Navient
Solutions, có thể tính toán giá trị thực tế của dữ liệu của công ty
mình.

Trên thực tế, Koch có thể thực sự tính bằng đô la, doanh thu tăng và
chi phí giảm bởi các thành tố dữ liệu khác nhau của công ty. Kết quả
là, cô ấy nhận thức rõ ràng rằng các vấn đề dữ liệu của Navient có thể
làm tổn thương lợi nhuận của nó. Một sai lầm trong một trường dữ liệu
quan trọng trong hồ sơ của khách hàng, ví dụ, có thể có nghĩa là
công ty không thể xử lý một khoản vay với chi phí thấp nhất.

"Có tiền liên quan ở đây, vì vậy chúng tôi có một bảng điều khiển chất
lượng dữ liệu, nơi chúng tôi theo dõi tất cả điều này. Chúng tôi theo
dõi giá trị thực tế và tiềm năng, ”cô nói.

Barbara Deemer, giám đốc quản lý dữ liệu và phó chủ tịch tài chính
cho biết, một sáng kiến liên quan đến dữ liệu gần đây tại Navient, một
công ty quản lý tài sản và dịch vụ xử lý kinh doanh có trụ sở tại
Wilmington, Del. Sáng kiến năm 2006 tập trung vào việc cải thiện
chất lượng dữ liệu cho tiếp thị và mang lại ROI $ 7,2 triệu, với lợi nhuận
thu được từ khoản vay tăng và giảm chi phí hoạt động.

Từ đó, các giám đốc điều hành của Navient đã cam kết hỗ trợ một
chương trình quản trị dữ liệu mạnh mẽ như một phần quan trọng trong
nỗ lực phân tích thành công. Chương trình quản trị của Navient bao
gồm các tiêu chuẩn tốt nhất được công nhận từ lâu, chẳng hạn như
chuẩn hóa các định nghĩa cho các trường dữ liệu và đảm bảo dữ liệu
sạch.

Chương trình quản trị của Navient gán quyền sở hữu cho mỗi phần tử
dữ liệu doanh nghiệp trong số khoảng khoảng 2.600 của nó; quyền sở
hữu được chuyển đến khu vực kinh doanh nơi trường dữ liệu được bắt
đầu lần đầu tiên hoặc khu vực kinh doanh nơi trường dữ liệu cụ thể
không thể tách rời với các quy trình của nó.
Công ty cũng có một chương trình giám sát chất lượng dữ liệu để đảm
bảo tiêu chuẩn cao được liên tục đáp ứng. Công ty cũng đã ra mắt Hội
đồng quản trị dữ liệu (năm 2006) và Hội đồng quản trị dữ liệu Analytics
(năm 2017) để giải quyết các câu hỏi hoặc mối quan tâm đang diễn ra,
đưa ra quyết định trên toàn doanh nghiệp và liên tục cải thiện hoạt
động dữ liệu và cách thức cung cấp dữ liệu phân tích của công ty.

Koch nói: “Dữ liệu rất quan trọng đối với các sáng kiến kinh doanh
của chúng tôi và các cơ hội kinh doanh mới, nên chúng tôi muốn tập
trung vào việc luôn cải thiện chất lượng dữ liệu hỗ trợ chương trình
phân tích của chúng tôi”.

Hầu hết các nhà quản lý đều đồng ý rằng quản trị dữ liệu là rất quan
trọng, dẫn đến sự tuân thủ, sự hài lòng của khách hàng và đưa ra
quyết định tốt hơn, theo State of Data Governance năm 2018 từ công
ty quản lý dữ liệu Erwin và UBM. Tuy nhiên, báo cáo cho thấy gần
40% các tổ chức ứng phó không có ngân sách riêng cho quản tr ị dữ
liệu và 46% không có chiến lược chính thức cho nó.

Phát hiện này dựa trên phản hồi từ 118 người trả lời, bao gồm CIO,
CTO, người quản lý trung tâm dữ liệu, nhân viên CNTT và tư vấn.

Với những con số đó, các chuyên gia cho rằng không có gì đáng ngạc
nhiên khi có nhiều điểm yếu trong nhiều chương trình dữ liệu doanh
nghiệp. Dưới đây là xem bảy thực hành dữ liệu có vấn đề như vậy.

Đưa dữ liệu lại với nhau, nhưng không thực sự


tích hợp dữ liệu
Tích hợp đứng đầu danh sách những thách thức trong thế giới dữ liệu
và phân tích hiện nay, theo Anne Buff, phó chủ tịch truyền thông cho
Tổ chức quản lý dữ liệu chuyên nghiệp.

Đúng vậy, nhiều tổ chức thu thập tất cả dữ liệu của họ ở một
nơi. Nhưng trong thực tế họ không tích hợp các phần khác nhau từ
nhiều nguồn dữ liệu, Buff giải thích. Vì vậy, dữ liệu của ông Bill Smith
từ một hệ thống không kết nối với dữ liệu của Bill Smith (và các biến
thể của tên của ông) được tạo ra bởi các hệ thống khác. Điều này
mang lại cho nhiều doanh nghiệp hình ảnh không đầy đủ của ông ta.

Các công nghệ tích hợp dữ liệu khác nhau cho phép lựa chọn, tri ển
khai và thực hiện đúng các công cụ là rất quan trọng để tránh làm
quá nhiều công việc thủ công hoặc làm lại cùng một công vi ệc.
Hơn nữa, tích hợp ngày càng trở nên quan trọng bởi vì các nhà khoa
học dữ liệu đang tìm kiếm các mẫu trong dữ liệu để thu được loại
thông tin chi tiết có thể mang lại những đột phá, lợi thế cạnh tranh.

Buff nói: “Nếu bạn không thể tập hợp những dữ liệu chưa bao giờ được
đưa ra trước đây, bạn sẽ không thể tìm thấy những mẫu đó”.

Không nhận ra các đơn vị kinh doanh có nhu


cầu riêng
Có, hợp nhất, dữ liệu tích hợp là rất quan trọng cho một chương trình
phân tích thành công. Nhưng một số người dùng doanh nghiệp có thể
cần một phiên bản khác của dữ liệu đó, Buff nói.

"Dữ liệu trong một hình thức không đáp ứng nhu cầu cho tất cả mọi
người trong tổ chức," cô nói thêm.

Thay vào đó, CNTT cần phải suy nghĩ về cung cấp dữ liệu, tức là cung
cấp dữ liệu cần thiết cho trường hợp kinh doanh được xác định bởi
người dùng doanh nghiệp hoặc bộ phận kinh doanh.

Cô lấy ví dụ nhu cầu khác nhau của một tổ chức tài chính. Trong khi
một số phòng ban có thể muốn dữ liệu tích hợp, bộ phận phát hiện
gian lận có thể muốn các nhà khoa học dữ liệu của họ sử dụng dữ liệu
không bị cố định không sạch sẽ để họ có thể tìm kiếm dấu hiệu khả
nghi. Họ có thể muốn tìm kiếm ai đó ở cùng một địa chỉ bằng cách sử
dụng các biến thể nhỏ của thông tin nhận dạng cá nhân của họ để
đăng ký nhiều khoản vay.

"Bạn sẽ thấy các yếu tố dữ liệu tương tự nhưng với một số biến, vì vậy
bạn không muốn loại bỏ quá nhiều phương sai đó và làm sạch nó quá
nhiều", Buff giải thích.

Mặt khác, cô nói, bộ phận tiếp thị tại tổ chức tài chính đó muốn có
phiên bản chính xác của tên, địa chỉ của khách hàng và các thông tin
tương tự để nhắm mục tiêu thông tin phù hợp.

Chỉ tuyển dụng các nhà khoa học dữ liệu,


không phải các kỹ sư dữ liệu
Khi các công ty tìm cách vượt xa BI cơ bản để phân tích dự báo và
quy tắc cũng như học máy và trí thông minh nhân tạo, họ cần tăng
trình độ chuyên môn về nhóm dữ liệu của mình.
Điều đó đã làm nổi bật tầm quan trọng của nhà khoa học dữ liệu. Kỹ
sư dữ liệu cũng rất quan trọng, là người sắp xếp tất cả các bộ dữ liệu
cần phải cùng nhau để các nhà khoa học dữ liệu thực hiện công vi ệc
của họ. Nhưng lại ít thu hút sự chú ý trong nhiều tổ chức hiện nay.

Điều đó đang thay đổi, theo lời của Lori Sherer, một đối tác trong văn
phòng San Francisco của Bain & Co và là trưởng nhóm Phân tích
nâng cao và kỹ thuật số của công ty.

“Chúng tôi đã thấy sự tăng trưởng về nhu cầu về kỹ sư dữ liệu gấp


khoảng 2 lần sự tăng trưởng nhu cầu về nhà khoa học dữ liệu”, Sherer
nói.

Cục Thống kê Lao động liên bang dự đoán nhu cầu về các kỹ sư dữ
liệu sẽ tiếp tục tăng trưởng nhanh chóng trong thập kỷ tới, với nền
kinh tế Mỹ bổ sung 44.200 vị trí từ năm 2016 đến năm 2026 với mức
lương trung bình hàng năm là 135.800 đô la.

Tuy nhiên, giống như nhiều vị trí quan trọng trong CNTT, các chuyên
gia nói rằng không có đủ kỹ sư dữ liệu để phù hợp với nhu cầu - làm
cho các phòng CNTT hiện đang bắt đầu thuê hoặc đào tạo để bắt kịp.

Giữ dữ liệu càng lâu càng tốt, thay vì quản lý


vòng đời của nó
Chi phí lưu trữ đã giảm đáng kể trong thập kỷ qua, cho phép CNTT dễ
dàng đủ khả năng để lưu trữ dữ liệu lâu hơn bao giờ hết. Điều đó có vẻ
giống như tin tốt, xem xét khối lượng và tốc độ dữ liệu hiện được tạo
ra cùng với nhu cầu ngày càng tăng để phân tích nó.

Nhưng trong khi nhiều người đã ca ngợi giá trị của việc có nhiều quỹ
và dữ liệu, Penny Garbus, đồng sáng lập của Soaring Eagle
Consulting tại Apollo Beach, Fla., Và đồng tác giả của Mining New
Gold nói. : “nó thường là quá nhiều của một điều tốt”.

Garbus nói quá nhiều doanh nghiệp nắm giữ dữ liệu quá lâu.

"Không chỉ là bạn phải trả tiền cho nó, nhưng nếu nó lớn hơn 10 năm,
rất có thể là thông tin là xa hiện tại", cô nói. "Chúng tôi khuyến khích
mọi người đặt một số mốc thời gian trên đó."

Ngày hết hạn cho dữ liệu thay đổi không chỉ từ tổ chức đến tổ chức, nó
thay đổi theo các phòng ban, Garbus nói. Bộ phận inventory trong
một công ty bán lẻ chỉ có thể muốn dữ liệu tương đối gần đây, trong
khi bộ phận marketing có thể muốn dữ liệu đã cũ để theo dõi xu
hướng.

Nếu đúng như vậy, CNTT cần triển khai kiến trúc cung cấp đúng
khung thời gian của dữ liệu đến đúng vị trí, để đảm bảo nhu cầu của
mọi người được đáp ứng và dữ liệu cũ không làm hỏng các chương
trình phân tích kịp thời.

Như Garbus lưu ý: “Chỉ vì bạn phải giữ dữ liệu cũ, không có nghĩa là
bạn phải giữ nó trong môi trường cốt lõi của mình. Bạn chỉ cần có nó.
"

Tập trung vào khối lượng, thay vì nhắm mục


tiêu mức độ liên quan
Steve Escaravage, phó chủ tịch cấp cao của công ty tư vấn IT Booz
Allen Hamilton cho biết: “Chúng tôi vẫn đang xây dựng các mô hình
và chạy phân tích với dữ liệu có sẵn nhiều nhất chứ không phải với dữ
liệu có liên quan nhất”.

Ông cho biết các tổ chức thường xuyên giữ quan điểm sai lầm rằng họ
nên nắm bắt và bổ sung thêm nhiều hơn và nhiều tập dữ liệu hơn. Ông
nói rằng họ nghĩ rằng "có thể có một cái gì đó trong đó mà chúng tôi
đã không tìm thấy hơn là hỏi: Chúng ta có dữ liệu đúng không?"

Xem xét, ông nói, rằng nhiều tổ chức tìm kiếm gian lận bằng cách
phân tích một lượng lớn dữ liệu để tìm kiếm những bất thường. Trong
khi các tổ chức hàng đầu cũng phân tích một số tập dữ liệu có mục
tiêu hơn có thể mang lại kết quả tốt hơn. Trong trường hợp này, họ có
thể xem xét các cá nhân hoặc tổ chức đang tạo ra một số loại giao
dịch nhất định có thể cho thấy sự cố. Hoặc các tổ chức chăm sóc sức
khỏe có thể xem xét, khi phân tích kết quả điều trị của bệnh nhân, dữ
liệu liên quan đến thời gian bao lâu bác sĩ đã ở trong ca làm vi ệc của
mình, khi họ cung cấp dịch vụ chăm sóc bệnh nhân.

Escaravage cho biết các tổ chức có thể bắt đầu bằng cách tạo danh
sách mong muốn dữ liệu. Mặc dù bài tập đó bắt đầu với khía cạnh kinh
doanh, "các cơ chế để nắm bắt nó và làm cho nó có sẵn, đó là lĩnh
vực của CIO, CTO hoặc giám đốc dữ liệu."

Cung cấp dữ liệu, nhưng bỏ qua nó đến từ đâu


Một trong những chủ đề lớn ngày nay là thiên vị trong phân tích, một
kịch bản có thể làm lệch kết quả hoặc thậm chí tạo ra các kết luận bị
lỗi dẫn đến các quyết định hoặc kết quả kinh doanh xấu. Các vấn đề
tạo ra thiên vị nằm trong nhiều đấu trường khác nhau trong một
chương trình phân tích doanh nghiệp - bao gồm cách CNTT xử lý dữ
liệu chính nó, Escaravage nói.

Quá thường xuyên, ông nói, CNTT không làm một công vi ệc đủ tốt
theo dõi nguồn gốc của dữ liệu mà nó nắm giữ.

"Và nếu bạn không biết điều đó, nó có thể ảnh hưởng đến hiệu suất
của các mô hình của bạn", Escaravage nói, lưu ý sự thiếu khả năng
hiển thị về cách thức và nơi dữ liệu bắt nguồn làm cho việc kiểm soát
thiên vị còn khó khăn hơn.

“Đó là trách nhiệm của IT để hiểu dữ liệu đến từ đâu và những gì đã


xảy ra với nó. Có rất nhiều đầu tư vào quản lý dữ liệu, nhưng cũng cần
có một giải pháp quản lý dữ liệu meta”, ông nói.

Cung cấp dữ liệu, nhưng không giúp người


dùng hiểu ngữ cảnh
CNTT không chỉ có chương trình quản lý siêu dữ liệu mạnh, nơi nó
theo dõi nguồn gốc của dữ liệu và cách nó di chuyển qua hệ thống
của nó, nó sẽ cung cấp cho người dùng cái nhìn sâu sắc về một số
lịch sử đó và cung cấp ngữ cảnh cho một số kết quả được tạo ra thông
qua phân tích, Escaravage nói.

“Chúng tôi rất vui mừng về những gì chúng tôi có thể tạo ra. Chúng tôi
nghĩ rằng chúng tôi có dữ liệu khá tốt, đặc biệt là dữ liệu chưa được
phân tích và chúng tôi có thể xây dựng mô hình về cách dữ liệu này
hữu ích”, ông nói. "Nhưng trong khi các phương pháp phân tích trong
nửa thập kỷ qua thật tuyệt vời, kết quả của những kỹ thuật này ít diễn
giải hơn trong quá khứ khi bạn áp dụng quy tắc kinh doanh sau khi
khai thác dữ liệu và dễ dàng diễn giải dữ liệu."

Các mô hình học tập sâu hơn, mới hơn cung cấp thông tin chi tiết và
gợi ý có thể hành động, Escaravage giải thích. Nhưng các hệ thống
này thường không cung cấp ngữ cảnh có thể hữu ích hoặc thậm chí
quan trọng đối với việc ra quyết định tốt nhất. Nó không cung cấp, ví
dụ, thông tin về xác suất so với sự chắc chắn rằng một cái gì đó sẽ
xảy ra dựa trên dữ liệu.

Giao diện người dùng tốt hơn là cần thiết để giúp cung cấp bối cảnh
đó, Escaravage nói.
“Vấn đề kỹ thuật là cách mọi người sẽ giao tiếp với các mô hình
này. Đây là nơi tập trung vào UI / UX từ quan điểm minh bạch sẽ rất
quan trọng. Vì vậy, nếu ai đó nhìn thấy đề xuất từ nền tảng AI, họ có
thể đi sâu đến mức nào để xem nguồn dữ liệu cơ bản, v.v.? ”, Anh
nói. “CIO sẽ phải hỏi làm thế nào để xây dựng vào hệ thống của họ
mức độ minh bạch.”

Nguồn: theo cio.com

You might also like