Kha Vo AI

Kha Vo AI Top AI & data scientist in AU/VN. Distinguished Talent AU citizen. Kaggle GRANDMASTER (10 competition GOLD medals, reached top 50/200K accounts).

Work for C[i], CBA, Oracle, H2O ai, UNSW. Finished PhD + postdoc at UTS. Visit khavo.ai for more.

09/02/2026

Helix, Rainwaves, and Blackhole: I’ve just invented 3 new nice js animation for my website (by vibe coding 😉)

05/02/2026

Winning cash prize ($10K💵) in a world-class AI competition is always SWEET🤑, because you also rank up the global leaderboard very quick!

And my solution write-up is finally UP!

https://khavo.ai/kaggle/2026/02/04/santa25.html

Also, follow my page (this page) if you haven't so, to get more high-quality contents about AI and data science!

I'm a little worn out actually, after 2 months of high intensity work. Will take a few days to refresh before beginning a new contest! Stay tuned!

31/01/2026

This is my final solution for packing n=1 to n=200 trees. Full write-up and code sharing in progress, will be shared on Kaggle and then here.

We won USD$10,000! And the more important: the gold medal!… by finishing at 3rd place over 3395 teams in this prestigiou...
31/01/2026

We won USD$10,000! And the more important: the gold medal!

… by finishing at 3rd place over 3395 teams in this prestigious yearly traditional AI competition (Santa series on Kaggle 🎅🏻). This is a great achievement I would say, because all of the top finishers are all computer science talents and geniuses around the world. I am the only Australian 🇦🇺 finishing in the top 100.

Exhausted. 2 relentless months of working. Special thanks to my teammates from 🇫🇷🇧🇪🇺🇦 as we come through this amazing journey.

Need a few days to write the solution write-up, and I'll share it later. In the meantime, I post a few images of some configurations how to pack n trees with minimal square side length. Enjoy!

https://www.kaggle.com/competitions/santa-2025/leaderboard

This is when I was finishing my PhD (in computer science), in my final year at UTS. Do you know why there weren’t too ma...
28/01/2026

This is when I was finishing my PhD (in computer science), in my final year at UTS.

Do you know why there weren’t too many people there? 😉

18/01/2026

It's 1:30 in the morning now, and it becomes more occasionaI that I feel tired/sleepy at this hour (though I usually stay up to 4-5 AM). It's easy to just let it be, watch a movie/football game, or go to bed. But I chose to 'struggle' a little bit with a few more work items.

In the long run this often distinguishes the good from the great, or the great from the best. Hope it'll be.

17/01/2026

'Data science' nowadays indeed isn't exactly science. There's no concrete or exact formula to express anything. It should be called 'data experimental science' since we need to spend lots of efforts on trial-and-error experiments, to find the suitable models, parameters, training data, evaluation metrics... to serve our purpose. Day by day, week by week, year by year, you'll start to feel that you'll need no more theory, no more equation, no more 'ideas'... One has to deep dive into the data/code/experiments to reap practical results.

😆
14/01/2026

😆

1 bài mình đã viết lâu, bây giờ có dịp post lại.Thi đấu ở những cuộc thi AI / data science trên (Google)'s Kaggle là thứ...
13/01/2026

1 bài mình đã viết lâu, bây giờ có dịp post lại.

Thi đấu ở những cuộc thi AI / data science trên (Google)'s Kaggle là thứ khủng khiếp nhứt. Why?

Thông thường người ta hay khoe mình đạt giải hackathon này kia... nhưng hackathon thường chỉ kéo dài vài giờ, hoặc vài ngày. Tập trung 1 chút là xong.

Data science competition thì RẤT KHÁC. Thông thường nó kéo dài TRÊN 3 THÁNG. Dữ liệu, vấn đề đc các host đưa lên, có khi lên tới hàng TB, nhưng nếu cuộc thi nào data cỡ MB thì vấn đề lại rất khó. Những vấn đề / bài toán luôn gắn liền với cuộc sống thực tiễn, và data cũng thực tế luôn.

Tất cả mọi người trên thế giới đều đc quyền tham gia, ko phân biệt tuổi tác quốc gia. Nói thẳng ra đây là những cuộc thi ĐỀ MỞ HOÀN TOÀN. CHO TOÀN THẾ GIỚI, cho dù anh có cheat, gian lận... cách nào cũng khó lòng. Why?

Bởi vì AI / data science thì ko bao giờ có lời giải chính xác. Khi 1 cuộc thi đc đưa ra, nó sẽ đi kèm với 1 "metric", tức là 1 công thức chấm điểm (như là độ chính xác chẳng hạn). Thông số này sẽ đc chấm dựa trên vô vàn data ẩn mà chỉ có model chính mình build mới "thấy" được khi submit model vào hệ thống. Do đó việc xem trước dữ liệu để giải tay hoặc "gắn nhãn" bằng mắt người là ko thể xảy ra. Hơn nữa, sẽ ko bao giờ có 1 phương pháp nào là tuyệt đối. Độ chính xác sẽ ko thể nào lên đc 100% vì dữ liệu đời thực ko cho phép điều đó. Do đó chỉ có thể cải thiện liên tục nhưng ko bao giờ lên đc sự hoàn mỹ. Các team top đầu sẽ chỉ xê xít nhau 0.00x (tức là mấy chữ số sau dấu phảy thập phân).

Và vì đó là cuộc thi online, nên thời gian ko giới hạn. Anh có thể thức ngày thức đêm để giải, để cải thiện mô hình, để thử nghiệm phương pháp mới. Người chơi sẽ luôn có cảm giác phải CHIẾN ĐẤU ko ngừng nghỉ. Vì nếu ngừng 1 chút, như là nghỉ vài ngày chẳng hạn, thì sẽ tạo cơ hội để các đội khác có nhiều thời gian hơn vượt lên trên bảng xếp hạng.

Đó là lý do tại sao những người xuất sắc trên Kaggle chính là những data scientist / AI scientist giỏi nhứt thế giới. Những con hàng "top" đều đc tuyển vào những vị trí đẹp ở những công ty xịn nhứt, như NVIDIA chẳng hạn. Còn nếu ko thì các start-up sẽ trả lương rất cao cho họ. Cuộc thi nào cũng sẽ xuất hiện vô số những người kiệt xuất mới toanh với những phương pháp độc đáo khác nhau (và rất phức tạp).

Bây giờ trên mạng bạn có thể tìm thấy hàng triệu triệu người làm / học trong lĩnh vực AI, nhưng để tìm ra hàng top Kaggle thì chỉ có vài trăm người. Ko phải vì đa số người ta ko có thời gian hay ko thích chơi, mà vì QUÁ KHÓ để lọt đc vô top 10 ở bất kì 1 cuộc thi nào! Người chơi phải hội đủ nhiều yếu tố: mạnh statistics, mạnh math, mạnh khả năng code (các top solution thường dài hơn 10K dòng code), cập nhật những model mới, phải lãnh hội đc cái gọi là "cảm giác về thống kê", và phải đủ yêu thích để theo đuổi. Do đó tuy cộng đồng 200K accounts trên đó thì chỉ 1 số hiếm chơi competition đều đặn, còn số đông còn lại là contribute cho các datasets hoặc notebooks mà thôi.

Hơn 8 năm chinh chiến trên đây, những thành tích ở các cuộc thi data science/ AI chính là thứ giúp mình có đc tất cả những thứ bây giờ: công việc, nhà cửa, vợ con, sự quen biết trong cộng đồng... Tuy nhiên, sự đánh đổi cũng khá lớn. Nhiều đêm miệt mài ko ngủ, nhiều lần mất huy chương phút chót sau mấy tháng trời... và nhiều cọng tóc bạc.

8 năm, 34 cuộc thi (10 hc vàng, 12 hc bạc), mấy chục ngàn giờ trên máy. Chưa có vấn đề nào mình chưa trải qua, từ quantum physics, quantum chemistry, computer vision, time-series, NLP, tabular data, pure math optimization, LLMs, hay ARC prize... mỗi thứ có 1 độ khó khác nhau đòi hỏi người chơi giỏi 1 mảng khác nhau.

Có người rất giỏi về build deep learning model cho các task computer vision, nhưng ko thể chơi time-series hay tabular data. Hay có người chuyên môn về các cuộc thi ít thiên về statistics và thiên về optimization nhìu hơn... Tất cả tập hợp lại thành 1 cộng đồng mở rất lớn với hơn 200K người.

Ngoài công việc chính thức ra (cũng nặng), mình phải tìm thời gian để đầu tư riêng cho những thứ này. Nếu ko mình sẽ bị tụt hậu dần dần. Chỉ có những chiến trường, nơi có kẻ thắng người thua, có sự khốc liệt, có mật ngọt và cay đắng, mới khiến người ta mạnh mẽ hơn.

Đã gần 6 tháng mình ko nghỉ ngày nào để tìm 1 hc vàng solo mới. Thực sự rất khó. Sự kiên trì, quyết tâm phải đạt tới đỉnh điểm thì mới thành công được. Bởi vì ai ai cũng vậy. Cuối cùng thành công hay ko thì lại là chuyện khác. Nhưng ko vì sợ mà ko dám làm.

2 tháng nữa mình sẽ đc nghỉ bớt và thoải mái 1 chút. Nhưng bây giờ thì chưa thể. Code base mình build cho cuộc thi lần này đã lên tới 50K dòng rồi..., quá nhiều... nhưng đã phóng lao thì phải theo, ko còn đường lui. Nếu ko đc, thì lại tốn mấy tháng để thử lại tiếp.

Đợi 1 dịp khác, mình sẽ viết về công việc professional chính thức của mình, chắc còn thú vị hơn nhiều lần.

Cảm giác sáng ngủ dậy mở Slack trên điện thoại thấy mấy instances chạy trên Kaggle có cái tìm ra improvements báo về cha...
13/01/2026

Cảm giác sáng ngủ dậy mở Slack trên điện thoại thấy mấy instances chạy trên Kaggle có cái tìm ra improvements báo về channel, sướng. ☺️

10/01/2026

Bin packing thực sự là 1 bài toán cực khó (tìm cách gói quà sao cho cạnh hộp vuông để gói N món quà là nhỏ nhứt. Quà mấy hình đơn giản như hình tam giác, vuông... đã khó rồi đừng nói tới cái hình cây thông như này 😀 (solver viết bằng Rust)
Santa 2025 (team Jingle Bins đang duy trì đc top 10 (hạng 4/2800):
https://www.kaggle.com/competitions/santa-2025/leaderboard

Mời bạn follow page mình mới lập nè.

Address

Sydney, NSW
2007

Alerts

Be the first to know and let us send you an email when Kha Vo AI posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share