Thợ làm Data

Thợ làm Data Chia sẻ về phân tích dữ liệu

1 số câu hỏi cũ rích trong group nhiều người hỏi đi hỏi lại :v Liệu ngành data có còn ngon? Hiện tại đang phân hóa. Các ...
29/05/2026

1 số câu hỏi cũ rích trong group nhiều người hỏi đi hỏi lại :v

Liệu ngành data có còn ngon?

Hiện tại đang phân hóa. Các công việc culi thường nhật trước đây : làm sạch dữ liệu, xây dựng dashboard cơ bản, viết báo cáo SQL,… đang ngày càng được tự động hóa. Các công việc phức tạp, đòi hỏi nhiều phán đoán ko có dữ liệu rõ ràng (chiến lược, kiến ​​trúc, giao tiếp với các bên, xác định vấn đề mới) đang ngày càng có giá trị.
Nếu theo nhóm đầu tiên và không hướng tới nhóm thứ hai, thì rất nguy cơ. Nếu bạn đã thuộc nhóm thứ hai — hoặc đang tích cực hướng tới — thì vẫn còn rất cần.

Nếu mới bắt đầu, tôi có nên tiếp tục học Python, SQL, PowerBi,… không?

Thực tế mảng này ko phải là làm dev, thì ko cần biết quá sâu về công cụ, nhưng ít nhất là biết cài đặt môi trường, gọi thư viện,… cú pháp hay code thế nào thì hỏi AI đã rất ngon. Biết mấy cái cơ bản là cũng đã đủ dùng rồi, sau này muốn tối ưu hay fix tốt hơn thì cải thiện dần. Nó cực kì hữu ích cho cả công việc văn phòng chứ ko phải chỉ là làm data. Đây là bộ skill cứng cho culi văn phòng hiện đại. Chỉ cần nắm được 1 cái sang các cái khác làm quen rất nhanh. Ai cũng thành BA vs tester cho con AI nó làm hết.

Nên mở rộng thêm skill tech thế nào?

Các role nó có nhiều skill giống nhau, nhưng nhìn chung vẫn có tí khác biệt về. VD DS tập trung vào việc trích xuất thông tin chi tiết từ dữ liệu (phân tích thống kê, mô hình hóa, diễn giải kinh doanh), phần lớn là xử lý Tabular data. Kỹ sư AI tập trung vào việc xây dựng các hệ thống sử dụng AI/ML trong production (API, triển khai, giám sát…), các loại dữ liệu phi cấu trúc. Nó chỉ chung nền tảng về toán, 1 số loại model và kỹ năng xử lý,... Hoàn toàn có thể đá chéo nhau.

- Nếu b học và làm DS, thiên về công nghệ, nên bổ sung các skill về các model và hệ thống AI.
- Nếu b học và làm DA thiên về business, nên bổ sung các skill về ML và cách sử dụng AI thôi

AI làm thay đổi gì trong công việc DA?

Cực kỳ nhiều thứ, bây h tôi cũng hơi nghiện dùng AI . AI giúp code nhanh hơn, tối ưu hơn. Các công việc trước đây rất mệt làm thủ công thì đã có thể gen code để chạy làm tự động tới 90%. Tuy nhiên việc dùng AI lại ko làm t nhàn hơn mà lại càng nhiều việc hơn, đc cái cảm giác khá hứng khởi lúc nào cũng muốn vọc triển khai đc nhiều thứ trc đây chỉ có thể tưởng tượng. 1 vấn đề gặp phải nữa là nhiều lúc cảm thấy lười mô tả các task hiện tại cho AI khi mà có việc nó trải qua quá nhiều bước và cũng thấy đang ổn, sửa lại sợ mất time :v

VD: bộ phận nghiệp vụ ko có task yêu cầu phải dựng luồng từ ETL dữ liệu tới báo cáo hoặc model, cũng ko có task yêu cầu dùng AI. Nhưng để chủ động và tự động hầu hết các task lặp đi lặp lại thì có thể tự triển khai đủ dùng phạm vi cá nhân. Chủ yếu là cần đọc và kiểm soát chính xác kết quả cuối trả ra.

AI có thể thay thế được người làm phân tích không ?

Skill technic giúp b có khởi đầu để bắt đầu công việc. Kỹ năng chuyên môn 1 lĩnh vực giúp tiến xa. AI có thể hỗ trợ bạn trong công việc kỹ thuật, hợp với level ban đầu. Việc phát triển khả năng đọc tính huống ngữ cảnh vẫn phụ thuộc nhiều vào kinh nghiệm.

T đc hưởng lợi nhiều từ việc AI càng ngày càng mạnh, nhưng nó làm rẻ đi nhiều thứ trước đây cần rất lâu để tích lũy. Các vấn đề thực tế cần giải quyết từ xưa tới nay nó vẫn như vậy, Ai nó chỉ làm thay đổi cách làm cũ chứ ko thể thay thế. Nếu chỉ dùng AI mà ko tối ưu thì nó là ngưỡng trung bình, vấn đề là cần tối ưu hơn kết quả của AI trả ra để chuyển dịch sang bên phải phân phối chuẩn :v

Trải nghiệm kiếm đu mênTự nhiên nhận ra 1 cái hành vi của bản thân đó là thỉnh thoảng tôi cũng phải khảo sát xem các bên...
24/05/2026

Trải nghiệm kiếm đu mên

Tự nhiên nhận ra 1 cái hành vi của bản thân đó là thỉnh thoảng tôi cũng phải khảo sát xem các bên khác đang hoạt động có gì hay ho mới mẻ không. Cách đơn giản đó là sử dụng dịch vụ của các bên khác xem quy trình và luồng họ thế nào. Mn hoàn toàn có thể thử cách này để có cái nhìn chung về dịch vụ trong 1 lĩnh vực cụ thể thế nào thay vì chỉ lý thuyết sách vở chung.

- Phân tích cho vay kiểu gì khi chưa từng vay nợ
- Phân tích đầu tư kiểu gì khi chưa từng đầu tư
- Phân tích đơn hàng kiểu gì khi chưa từng bom hàng
- …

Khi là khách hàng trực tiếp thì sẽ dễ dàng nhìn ra điểm hay ho và hạn chế của nền tảng đó. Cách tốt nhất để hiểu dữ liệu đó là tự mình tạo ra dữ liệu đó. Thay vì nhìn dữ liệu chết trên SQL, việc đóng vai người dùng để hiểu "vòng đời" của một giao dịch nó dễ hình dung hơn nhiều.

Vì là làm trong mảng tín dụng nên t có dùng và vay, gửi, sử dụng ở 1 số nền tảng khác nhau tùy vào mục đích chứ ko có cố định 1 app nào, mặc dù các super app hiện tại đều gần như có thể làm đc hết trong 1. Cái này chắc ai cũng thấy thế :

- Nhận lương, vay gửi ưu tiên app bank
- Thanh toán : dùng app fintech
- Mua hàng : ứng dụng mua hàng kiểu Shopee
- Đi xe: ứng dụng kiểu grab gọi xe
- Đầu tư: app sàn CK hoặc sàn CEX

App bank càng ngày càng giống app fintech và cũng gần giống mấy app bên thứ 3, đó là đều có thể liên kết tài khoản để thanh toán qua lại. Cái này gọi là chiến lược Tài chính nhúng trong Fintech mn chắc cũng có nghe.

Thực sự là t ko quan tâm vay gửi ở app nào mà chủ yếu quan tâm bên nào lãi gửi cao nhất, cho vay lãi thấp nhất để vay, đi so tay từng bên khá mệt. Cái này chắc nhiều người cũng thấy và nghĩ ra rồi nhưng mà Open banking của các bên nó ko chi tiết đc tới mức đó — vì API ngân hàng chỉ trả về số dư, lịch sử giao dịch. Còn "có được duyệt vay không, lãi suất thực tế với profile của là bao nhiêu" thì không app nào trả lời được trừ khi tự submit hồ sơ từng bên một.

Hiện tại hình như chưa có 1 bên nào làm 1 cái layer trung gian hoặc là 1 con Agent tư vấn realtime vay gửi 1 cách tối ưu này, ko cần chính xác, chỉ cần đưa được 1 khoảng range min max đc là cũng oke lắm rồi, hi vọng có tay to đọc đc bài này và làm thật.

Ps: thích Homecredit vì vay lâu rồi nhưng hay đc offer lại đúng lúc hết tiền :v

WTF man claude AI pro Opus 4.7Thôi ít ra m còn biết nói thật 😢
15/05/2026

WTF man claude AI pro Opus 4.7
Thôi ít ra m còn biết nói thật 😢

Quy trình xây dựng Credit ScorecardAcc cũ khóa nên các bài viết cũ đã bay màu hết, t viết lại 1 ver mới vjp hơn và cũng ...
13/05/2026

Quy trình xây dựng Credit Scorecard

Acc cũ khóa nên các bài viết cũ đã bay màu hết, t viết lại 1 ver mới vjp hơn và cũng để nhá hàg :v

Các bài toán trong rủi ro, sản phẩm vay tự động nó sử dụng phương pháp gần như y hệt, đó là trích lọc được ra các nhân tố phân biệt khách hàng Tốt/Xấu để từ đó tạo ra các điều kiện sang lọc hoặc để lượng hóa ra thẻ điểm.
Khi đã nắm được bí kíp thì các bài toán nó đều tương tự nhau, khác nhau ở phần mục đích. VD:

- Mô hình A-B-C Score mục đích đánh giá khả năng vỡ nợ, thường định nghĩa khách hàng quá hạn >= 90 ngày trong vòng 12 tháng theo Basel để flag khách hàng xấu
- Mô hình cảnh báo sớm EWS mục đích là cảnh báo sớm khách hàng trước khi xảy ra tình trạng q úa hạn nên thường định nghĩa khách hàng quá hạn >= 10 ngày trong vòng 3 tháng để flag khách hàng xấu.
- Các bài toán sản phẩm tự động/ bán thêm mục đích là tìm ra tiêu chí khi khách hàng thỏa mãn thì auto cho qua, thường định nghĩa flag giống các mô hình rủi ro hoặc flag là các khách hàng có sử dụng dịch vụ trong vòng 3/6 tháng ,…

Có 1 sự khác biệt phương pháp làm các bài toán này giữa thực tế với khi mọi người đọc các bài mẫu trên Kaggle, gây ra 1 sự lệch pha. Các bài toán này mục đích không phải là để phân loại khách hàng có vỡ nợ hay không để từ chối mà nó cần 1 sự minh bạch đánh giá khả năng vỡ nợ của khách hàng để có phương án tiếp cận phù hợp, tất cả điều kiện đánh giá, trọng số phải tường minh sau này còn có kiểm toán.

Ví dụ: có 2 hồ sơ vay 500 triệu
- Hồ sơ 1: Nhân viên IT, 23 tuổi, lương 20tr/tháng, chưa vay nợ bao giờ
- Hồ sơ 2: Bán phở, 40 tuổi, không chứng minh được thu nhập, có lịch sử trả góp mua xe máy tốt
Không thể duyệt dựa vào cảm tính hoặc duyệt dựa vào 1 cái model để từ chối khách hang. Sẽ cần phải có bộ thẻ điểm tường minh:
- Hồ sơ 1: Nhân viên vp: +60 điểm, tuổi < 25: -10 điểm, lịch sử null : +10 điểm ….: tổng 570 điểm
- Hồ sơ 2: lao động tự do: -20 điểm, tuổi 25-45: +30 điểm, lịch sử tốt : +70 điểm ….: tổng 610 điểm

Quy trình xây dựng bài toán Scorecard sẽ như sau:
- Bước 1: Thiết kế Features (Longlist)
- Bước 2: Features Engineering
- Bước 3: Làm sạch dữ liệu
- Bước 4: Phân tích đơn biến: đây là bước key xử lý và chuyển đổi dữ liệu trong mô hình thẻ điểm. Dữ liệu được xử lý qua thuật toàn Greedy Binning và chuyển về WOE, IV và sàng lọc dựa trên kinh nghiệm. Không cần smote, không cần sampling, không cần loại anomaly,..
- Bước 5: Phân tích đa biến: Hồi quy logistic kết hợp 1 số phương pháp thử nghiệm tổ hợp kết quả tối ưu (Stepwise)
- Bước 6: Kiểm định mô hình: GINI, KS, PSI,…
- Bước 7: Chuyển đổi thang điểm
- Bước 8: Chuyển đổi ra hạng: phần này phải căn chỉnh hợp lý dựa theo tình hình thực tế và khẩu vị rủi ro riêng để có phổ hạng và điểm cắt tối ưu

Anh Max cho kiếm tiền bằng page ah, chắc lại phải chăm chỉ đăng bài :v
07/05/2026

Anh Max cho kiếm tiền bằng page ah, chắc lại phải chăm chỉ đăng bài :v

Hôm trc nhá hàng làm bộ Scorecard bằng bộ data Homecredit Default risk, t có đăng ảnh phân phối phổ hạng. Có chuyên gia ...
28/04/2026

Hôm trc nhá hàng làm bộ Scorecard bằng bộ data Homecredit Default risk, t có đăng ảnh phân phối phổ hạng.
Có chuyên gia nhìn phát biết ngay ko ổn nên đã ib góp ý. Rất cảm ơn chuyên gia.
Phần calibrate model là 1 phần thử đi thử lại theo mong muốn cân bằng của bộ phận model và bộ phận kinh doanh. Ảnh hôm trc là xây thử bằng full bộ data, t đã chia ra làm 2 bộ score theo sản phẩm.
Kết quả của bộ Cashloan sau khi calibrate, trên thực tế có thể phải căn chỉnh nhiều hơn. Bộ data là bộ của công ty tài chính nên ngưỡng cutoff nó ko thể nào thấp như bank được
Gini 42%
Psi 0.01

Ma trận nghề nghiệp mảng phân tích dữ liệu trong tài chínhCó 1 vài cháu ib hỏi tôi bày tỏ nguyện vọng muốn làm phân tích...
26/04/2026

Ma trận nghề nghiệp mảng phân tích dữ liệu trong tài chính

Có 1 vài cháu ib hỏi tôi bày tỏ nguyện vọng muốn làm phân tích dữ liệu trong mảng tài chính và nhờ tôi mentor (có thể là do thấy t hay đăng bài mảng này), tôi mới hỏi lại là “Bạn muốn làm cụ thể vị trí nào ?”
Hầu hết các cháu đều lúng túng và tỏ ra ko rõ ràng định hướng vị trí nào, chỉ biết là phân tích tài chính :vCái này cũng bình thường thôi vì đúng là nó đang hơi rối, tôi sẽ mô tả lại chỗ này 1 chút.

Phân chia theo chương trình học Đại học

Nếu nhìn vào các chương trình đào tạo liên quan đến Tài chính ở Đại học, có thể gom tạm làm 3 nhóm, nhóm nào cũng có một "điểm mù" khi bước ra đi làm:

- Các ngành Tài chính truyền thống (Tài chính ngân hàng, tài chính doanh nghiệp, tài chính quốc tế, tài chính công,…): Chương trình nặng các vấn đề nghiệp vụ, trải rộng mọi hướng từ bank, doanh nghiệp, đầu tư : đọc đc cáo tài chính, hiểu bản chất dòng tiền, biết định giá doanh nghiệp, hiểu thế nào là lãi suất, lạm phát, tỷ giá. Điểm yếu: skill về tech và dữ liệu
- Các ngành Toán, Tài chính định lượng: Toán, Xác suất thống kê và Mô hình. Đây là hệ tư tưởng chuộng tính toán học thuật. Điểm yếu: thiếu business sense và nhiều khi quá học thuật, không update kịp tech hiện tại.
- Các ngành mới kiểu Fintech, Data Science trong Fin, MIS : Mạnh về công cụ, hệ thống. Điểm yếu: Hơi nửa nạc nửa mỡ nếu chưa có kinh nghiệm hoặc 1 bộ skill cứng, hơi mất định hướng

Phân chia theo công việc thực tế

Mảng fin kể cả mọi người làm cho bank, doanh nghiệp, cty chứng khoán, quỹ,… thì phần phân tích dữ liệu fin nó cũng sẽ chia khá rõ ràng ra 2 phần:

- Phân tích ở mảng khách hàng cá nhân (Retail Banking/ Consumer Finance) : Phần này sẽ hợp và đúng định hướng làm phân tích dữ liệu, sử dụng dữ liệu để “Data Driven” :v Đơn giản là dữ liệu của khách hàng cá nhân rất nhiều, được áp dụng nhiều công nghệ mới và bài toán áp dụng cho số đông.
Chương trình học trong trường ĐH lại thường nhắc tới rất ít phần tài chính cá nhân này, nó không có nhiều thuật ngữ về Fin như tài chính doanh nghiệp. Mảng phân tích dữ liệu của khách hàng cá nhân có rất nhiều bài toán áp dụng trong cả bank và công ty fintech.

- Phân tích ở mảng khách hàng doanh nghiệp (Coporate Finance/Investment,…): Phần này mn sẽ thấy nó nặng ở các chương trình tài chính truyền thống, học rất sâu vào các chỉ số báo cáo tài chính, vốn, định giá,… Các chỉ số này gặp trong cả bank và các công ty chứng khoán, đầu tư. Dữ liệu của khách hàng doanh nghiệp nó ít hơn nhiều khách hàng cá nhân và nó không nặng về mô phỏng hành vi số đông. Mỗi 1 bộ hồ sơ là 1 case khác nhau và deal khác nhau và cần 1 mức độ chuyên gia trong ngành để đánh giá “Finance Driven”.
Chương trình của các ngành mới Fintech, MIS, DS,… nó giảm tải rất nhiều phần của Corporate Finance mà thêm vào các phần về Dữ liệu và Tech.

Có nên thi các chứng chỉ kiểu CFA hay FRM?

Có điều kiện thì cứ thi, càng tốt. Nó thể hiện b có 1 nền tảng tốt và nó sẽ là điểm cộng lớn trong mảng tài chính doanh nghiệp.
- CFA nó đi sâu vào các chỉ số tài chính doanh nghiệp. Hợp làm Invest Bank hoặc quỹ
- FRM nó đi sâu vào quản trị rủi ro, mô hình. Làm rủi ro cả cá nhân hoặc doanh nghiệp.

Chốt lại theo hướng nào cũng sẽ cần mạnh sử dụng công cụ.
Tuy nhiên có chút khác biệt để từ đó tập trung học những cái liên quan:

- Nếu bạn mong muốn nghiêng về ứng dụng công nghệ, dữ liệu, mô hình xử lý bài toán thì có thể tập trung vào mảng khách hàng cá nhân. Mảng này thay đổi nhanh và chịu nhiều ảnh hưởng của AI hơn.
- Nếu thích hiểu sâu về Fin, phân tích báo cáo tài chính, vĩ mô thì theo mảng tài chính doanh nghiệp. Mảng này khó vào hơn, chịu nhiều ảnh hưởng về kinh nghiệm người làm. AI nó chỉ hỗ trợ chứ quyết định chốt hạ vẫn ở người.

Cách lựa chọn khóa họcDạo này nhiều người đòi review khóa học, hỏi học ở đâu chất lượng. Cái này mn cũng đã bàn nát trướ...
22/04/2026

Cách lựa chọn khóa học

Dạo này nhiều người đòi review khóa học, hỏi học ở đâu chất lượng. Cái này mn cũng đã bàn nát trước đây.

Học trung tâm lớn thì nó phải mở rộng đại trà và phổ thông số lượng lớn nên chương trình sẽ thường fix dạng cơ bản, ai cũng học được. Cho nên thường thể ko đi vào 1 domain cụ thể, lướt qua và tập trung vào phần công cụ. Chất lượng cũng từ trung bình đổ lên, thấy tệ thì yêu cầu đổi lớp, hoàn tiền, bảo lưu,…, ncl có dịch vụ support, người học cũng đc 1 phần nền tảng và thuật ngữ cơ bản.

Học của 1 cá nhân nào đó thì chương trình nó có thể sâu vào 1 ngách nào đó hơn, đồ real task real hơn. Nhưng mà hên xui về ng dạy, ko đổi lớp đc, học xong chưa chắc đã áp dụng được vì khác lĩnh vực. Đc cái ng dạy thường mạnh và đã có fame nhất định.

Lựa chọn thế nào ?

Chịu, phải học thử mới biết được, nhưng mà mn có thể tìm hiểu để có 1 cái cảm giác nhất định xem khóa đó có hợp ko:

- Khóa học đc thiết kế tốt thường note rất rõ từng buổi học cái gì, nội dung gì, bao nhiêu buổi. Ko đại khái, ko để lộ trình chung chung thời gian dài mà ko rõ có gì bên trong. Xem lộ trình tập trung công cụ hay 1 ngách bài toán cụ thể.
- Điều tra profile xem thợ dạy thế nào, xem cách hành văn thế nào. Có thể đọc qua các bài viết, chia sẻ. Nếu b cảm thấy hiểu thì oke. Việc dạy học là thợ dạy giúp đơn giản lại các khái niệm phức tạp cho b hiểu chứ ko phải càng đọc càng lú hay là thể hiện cái gì quá đẳng cấp.
- Xem review từ cộng đồng – tất nhiên rồi
- Mức giá xem có phù hợp ko. Lộ trình ko có gì đặc biệt mà giá cao hơn hẳn các chỗ khác thì ko đáng lắm.

Những chỗ nào mà bao tiêu đầu ra phần lớn là xàm để chốt sale. Chủ yếu b sẽ đc support trong quá trình tìm việc hỗ trợ apply, sửa cv,… còn có pass hay ko, pass trong bao lâu, tại sao ko pass thì bạn tự chịu. Quên việc đc cam kết hoàn tiền đi, đã chui vào rồi ko có đường ra :v

Tóm lại thì khóa học nào nó cũng có 1 cái giá trị gì đấy, có điều kiện thì cứ học hết. Học xong ko có job hoặc ko dùng được đơn giản là hiện tại chuẩn yêu cầu nó đã cao hơn đầu ra của khóa học đó. Có những cái mà bạn có hỏi AI làm thì nó cũng ko giúp bạn làm được nếu chưa từng va chạm, hoặc là làm theo AI ra không biết đúng hay sai, thực tế có đúng như vậy không ? Nếu gặp tình trạng và các bài toán như vậy thì nên tìm người dạy.
------------------
Quảng cáo

Làm khóa học cũng như làm sản phẩm, thiết kế ra được 1 khóa học ưng ý rất khó. Trước đây tôi dùng lộ trình của Microsoft, ra 1 khóa và ko mất nhiều thời gian chỉnh sửa. Tuy nhiên nó cũng outdate dần và ng học ko còn hứng thú. B nào có tham gia group cũ của tôi thì có biết tôi ấp ủ 1 khóa thực hành bằng bộ data Home Credit Default Risk mô phỏng quy trình xử lý bài toán thực tế. Bộ này tôi đánh giá là sát với data thật và đủ xử lý đc 1 số bài toán như thật : Credit Scorecard, EWS, Auto Loan,… Với những bài ngách thì rất khó sao chép và b có hỏi AI cũng ko mô phỏng chính xác theo kinh nghiệm người làm được.

Phần demo tôi đã thử và căn chỉnh xong từ lâu, nhưng mà khi muốn đóng gói vào 1 khóa học tầm 10 buổi thì đang tắc vì nó quá phức tạp cả về lý thuyết và thực hành. Khó mở rộng người học. Chắc chắn sẽ có lúc publish, các thợ dạy khác lại mất 1 miếng bánh :v

Vừa ngồi xuống ghế, nhấp 1 ngụm trà, mở chiếc máy tính quen thuộc check mail, điện thoại bỗng tingting. Không phải là th...
17/04/2026

Vừa ngồi xuống ghế, nhấp 1 ngụm trà, mở chiếc máy tính quen thuộc check mail, điện thoại bỗng tingting.
Không phải là thông báo ngân hàng mà là tin nhắn của 1 stalker của page :v
Nhu cầu hiện tại người học vẫn rất nhiều, job cũng nhiều, không phải quá bi quan. Chỉ là cần phải biết được bài real task real mới đúng nhu cầu đem đi phỏng vấn do yêu cầu bị đẩy cao lên và phân hóa theo lĩnh vực, mặc định đã biết sử dụng công cụ.
Các thợ dạy cứ tranh thủ húp mạnh kẻo sau này lại thêm nhiều đối thủ :v

Bài dài về Kiểm định mô hình rủi ro - Model Validation
04/04/2026

Bài dài về Kiểm định mô hình rủi ro - Model Validation

Address

Hanoi
100000

Alerts

Be the first to know and let us send you an email when Thợ làm Data posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share