DataWorkshop

DataWorkshop DataWorkshop is the right place to learn and teach about machine learning and data science. https://

06/03/2026

Sprawdź

21/10/2025

Jesień 🍁 Najlepsze prompty pisze natura…

Dzięki   🤝 Dużo emocji, dużo spotkań, tyle ciekawych ludzi, jeszcze więcej pomysłów na AI przyszłość…
19/10/2025

Dzięki 🤝 Dużo emocji, dużo spotkań, tyle ciekawych ludzi, jeszcze więcej pomysłów na AI przyszłość…

LLM bez ściemy – co działa naprawdę?  Zapraszam  , 19 lutego, ~150 uczestników, praktyczna wiedza, świetny networking! 🔥...
29/01/2025

LLM bez ściemy – co działa naprawdę? Zapraszam , 19 lutego, ~150 uczestników, praktyczna wiedza, świetny networking! 🔥 Przetestowałem 100+ modeli, przetworzyłem miliony tokenów – teraz dzielę się konkretami.

W DataWorkshop jesteśmy na przecięciu trzech obszarów: edukujemy, prowadzimy R&D (eksperymentujemy) oraz realizujemy realne projekty ML (w tym także bezpośrednio związane z LLM). Część projektów LLM jest już zakończona, a część wciąż rozwijamy. Coś tam już zrozumiałem 🙂.

Nie wszystko, co widzisz o LLM w social media, działa w praktyce. Większość to marketingowy hype – pełen halucynacji (jak u ludzi tak i u LLM), niestabilności i rozwiązań, których nie da się skalować ani utrzymać w praktyce. Co najwyżej nadaje się jako efekt wow, czyli zrobić chwilowe wrażenie.
.. ale to wcale nie znaczy, że LLM to ślepa uliczka!

Trzeba po prostu nauczyć się, jak robić to dobrze. Paradoks polega na tym, to co działa to dość prosty mechanizmy, które zwykle wymagają myślenia... tak, tak nadal trzeba myśleć, bo LLM za nas tego nie zrobi. O tym też dość dużo mówię w moim podcaście Biznes Myśli. Też opowiem esencje tego na na żywo na .

📍 Gdzie? Białystok: https://www.facebook.com/events/623979946850336/
📅 Kiedy? 19 lutego 2025 (środa) o 18:00

Dla kogo?
--> Programistów
--> Data Scientistów
--> Studentów IT
--> Pasjonatów danych i Pythona


Wojciech i Piotr, bardzo Wam dziękuję za zaproszenie na 70. edycję . Zapowiada się bardzo ciekawe i wartościowe wydarzenie.

P.S. Będziesz 19 lutego w Białymstoku lub okolicy? Wpadaj, bo warto!

P.P.S. W lutym planujemy kilka innych spotkań na żywo w różnych miastach, m.in. w Krakowie i Warszawie. Chyba tam też ludzie interesują się praktycznym LLM? 🤔 Daj proszę znać w komentarzu, czy faktycznie tak jest!

Chcesz być na bieżąco? Obserwuj mnie i zaproś do sieci swoich znajomych.

– widzimy się tam!
---

Zmagasz się z chaosem w świecie LLM? Halucynacje i niespójne wyniki odbierają Ci pewność? Frustruje Cię nieskończona ilość narzędzi LLM? Mam na to rozwiązanie!

Mam dla Ciebie rozwiązanie! W kursie "Praktyczny LLM" ruszamy 24 lutego (już ponad 100 osób na pokładzie, nie może Cię tam zabraknąć). Pokażę Ci moje "tricki" budowania solidnych, wiarygodnych systemów AI. Poznasz skuteczne metody walidacji danych, stabilizacji RAG, Agenci AI i łączenia klasycznego ML z LLM. Tego nie znajdziesz w internecie. Zapisz się na listę oczekujących.

👉 https://dataworkshop.typeform.com/to/XSBGKwVV?utm_source=fb&utm_medium=post&utm_campaign=llm&utm_term=vladimir&utm_content=profile

Jak zapanować nad armią baranów? Podcast Biznes Myśli i nowy odcinek czeka na Ciebie :). Choć szum wokół LLM powoli cich...
24/10/2024

Jak zapanować nad armią baranów? Podcast Biznes Myśli i nowy odcinek czeka na Ciebie :). Choć szum wokół LLM powoli cichnie, ich prawdziwy potencjał dopiero się ujawnia. Kluczem do sukcesu nie jest ślepe podążanie za trendami, ale świadome i ustrukturyzowane podejście, oparte na zrozumieniu zarówno możliwości, jak i ograniczeń tych modeli.

https://www.youtube.com/watch?v=hJVD876wDyA
lub tu poczytaj: https://biznesmysli.pl/praktyczny-llm/

Pamiętaj, że LLM to nadal ML! Niepewność i błędy to nieodłączna część uczenia maszynowego. Zamiast oczekiwać cudów, skup się na zarządzaniu ryzykiem, weryfikacji wyników i budowaniu mechanizmów kontroli.

Skoncentruj się na strukturze i kontroli. Definiuj precyzyjne schematy wejścia i wyjścia dla swoich modeli, korzystaj ze "structured output" i waliduj każdy etap procesu. Traktuj LLM jak element większego systemu, który wymaga odpowiedniego zaprojektowania i nadzoru.

Nie ufaj ślepo leaderboardom. To, co sprawdza się w testach, nie zawsze przekłada się na realne problemy. Twórz własne benchmarki, dostosowane do specyfiki Twoich zastosowań.

I dodam jeszcze nie daj się oczarować przez podejście no-code! Proste interfejsy mogą k**ić, ale tylko praca na poziomie kodu daje elastyczność i kontrolę niezbędną do budowania stabilnych i skalowalnych rozwiązań. Nie bój się kodu – jego tworzenie jest dziś prostsze niż kiedykolwiek, a LLM może Ci w tym pomóc.

Kluczowe kroki wdrożenia LLM:

1. Naucz się rozmawiać z LLM przez API. Poznaj podstawy promptowania, kluczowe modele i parametry.
2. Wprowadź strukturę na wejściu i wyjściu. Wykorzystaj formaty takie jak JSON i koncepcję "structured output".
3. Zastosuj walidatory i mechanizmy naprawcze. Zminimalizuj liczbę błędów i zwiększ swoje zaufanie do wyników.
4. Wykorzystaj koncepcję RAG i mapy wiedzy. Wzbogać generowanie tekstu o wyszukiwanie kontekstu i ustrukturyzowaną wiedzę.
5. Mapa wiedza, to jest instrukcja dla LLM co on ma zrobić. Podobnie jak piszemy takie instrukcji dla ludzi, aby trzymać pewny standard, tu trzeba zrobić podobnie.
6. Zintegruj LLM z klasycznym ML. Połącz siłę obu podejść, aby osiągnąć jeszcze lepsze rezultaty.
7. Optymalizuj prompty zamiast fine-tuningu (zwykle to jest co chcesz zrobić). Skup się na prostych i efektywnych rozwiązaniach.

A o co chodzi z tymi baranami? Nie chcę obrażać LLM, ale nasunęła mi się ciekawa analogia, która może Ci się spodobać. Podobnie Napoleon kiedyś powiedział, że "Armia baranów prowadzona przez lwa jest silniejsza od armii lwów dowodzonej przez barana!" Chodzi mi o to, że jako "lew" poradzisz sobie zarówno z baranami, jak i z LLM-ami, potrafisz je odpowiednio zorganizować. LLM trzeba "ustawić" w taki sposób, aby mógł w pełni otworzyć swój potencjał dla Ciebie w dojrzały sposób i przynieść wartość dla Ciebie. Bądź tym dowódcą! Zdefiniuj cele, procesy i struktury, a LLM stanie się potężnym narzędziem w Twoich rękach.

Chcesz aby nauczyłem Ciebie jak to robić w praktyce? Daj znać, już mam swoje "tricki", nieoczywiste, ale bardzo fajne jest je poznać, jak myślić o LLM produkcyjnie :).

🎧 Słuchaj BM wygodnie na Spotify, Apple Podcasts lub Google Podcasts:
📌 https://open.spotify.com/show/3ZUaHommHHZU6b4WJiyV2I
📌 https://podcastaddict.com/podcast/biznes-mysli/3028512
📌 https://podcasts.apple.com/us/podcast/biznes-myśli/id1215290277
📌 https://music.youtube.com/playlist?list=PLWOCRT27Z94XZzwcRI9-ExMyUXeBrF3W_

🔔 Subskrybuj i włącz powiadomienia - Twoja droga do praktycznego ML zaczyna się od jednego kliknięcia: https://www.youtube.com/?sub_confirmation=1
👍 Zostaw like, bo więcej lajków = więcej praktycznych treści dla Ciebie!
💬 Co o tym myślisz? Zostaw komentarz! Masz pytanie? Zadaj je - chętnie odpowiem.
🤝 Poznajmy się lepiej! Zaproś mnie do swojej sieci na LinkedIn: https://www.linkedin.com/in/vladimiralekseichenko/
🔊 Zainicjuj rozmowę o ML w firmie, polecając ten podcast. Zainspiruj zespół do wdrażania ML!

Ciemna strona prototypowania AI (odłuschany odcinek na Biznes Myśli?).AI k**i prostotą, ale budowa realnych rozwiązań to...
17/10/2024

Ciemna strona prototypowania AI (odłuschany odcinek na Biznes Myśli?).

AI k**i prostotą, ale budowa realnych rozwiązań to nadal wyzwanie. Przechodzimy przez fazę "łatwego wejścia", jak kiedyś w "dzikich" czasach PHP (przepraszam za przykład), co rodzi ryzyko powtórki z historii i fali niedopracowanych projektów.

Co sprawdza się z LLM z mojego doświadczenia (i gorąco polecam):

1️⃣ Kluczem do sukcesu z LLM jest zrozumienie danych. Nie polega to tylko na pobieżnym przejrzeniu, ale na ręcznej analizie i "zanurzeniu się" w ich strukturę. To jedyna droga do wyboru optymalnej strategii i stworzenia skutecznego rozwiązania. Narzędzia są pomocne, ale nic nie zastąpi wkładu człowieka. Nie ma narzędzie z pudła, które zrobią to robotę dobrze za Ciebie, tutaj nadal trzeba myśleć 🤔

2️⃣ Proste rozwiązania nadal bywają skuteczne (i efektywne). Nie daj się złapać w pułapkę "modnych" rozwiązań. Czasem nawet prosta i hierarchiczna struktura danych oraz dobrze dobrane metadane potrafią zdziałać cuda, zapewniając przy tym przejrzystość, kontrolę i łatwość debugowania. Dopiero na solidnym fundamencie ręcznej pracy warto budować automatyzację.

3️⃣ Zanim zautomatyzujesz i wyskalujesz (używając "modną" bibliotekę), upewnij się, że masz co skalować, że rozwiązanie działa (na mniejszych próbkach). W przypadku konkretnych problemów biznesowych i ograniczeń czasowych, ręczna praca często jest nieoceniona. Owszem to inwestycja, która zwraca się w postaci szybszego osiągnięcia celu.

4️⃣ Nie daj się zwieść szybkiemu "efektowi wow". Warto od razu myśleć i stawiać na rozwiązania transparentne, audytowalne i dające Ci (pełną) kontrolę. Mniej problemowego wdrożenia i łatwejszego debugowania w przyszłości.

5️⃣ LLM z jest nieprzewidywalny (to jego natura), ale "poskromić" go można narzucając "twardą" strukturę na wejściu i wyjściu danych. "Structured Input/Outputs" to klucz do przewidywalności i stabilności.

6️⃣ Embeddingi to nie wszystko. Połącz je z wyszukiwaniem po słowach kluczowych (stara dobra sprawdzona wyszukiwarka), aby zwiększyć trafność odpowiedzi i uprościć rozwiązanie.

7️⃣ "Modne" rozwiązania (biblioteki, frameworki, platformy) w LLM, jak LangChain czy CrewAI, w mojej opinii świetnie sprawdzają się w prototypowaniu, ale często nie nadają się do środowiska produkcyjnego. Brakuje im transparentności, audytowalności, kontroli, co utrudnia zbudowanie zaufania do rozwiązania.

Co o tym myślisz? Który punkt jest najbardziej rezonuję z Tobą?

W DataWorkshop powstaje praktyczny kurs o LLM. Jest na finalnej prostej.
Dlatego jeśli zmagasz się z przekształceniem szumu wokół LLM w realne, praktyczne umiejętności i chcesz aby nauczyłem Cię jak praktycznie podejść do LLM. Tu jest link do chętnych (oraz możliwość wpłynąć na finalną wersje agendy):
https://dataworkshop.typeform.com/to/XSBGKwVV?utm_source=facebook&utm_medium=post&utm_campaign=llm&utm_term=vladimir&utm_content=profile

Skupimy się na tym, jak tworzyć rozwiązania oparte na LLM dla prawdziwych problemów z myślą o wdrożeniu na produkcje.

P.S. W DataWorkshop zawsze stawiamy na praktyczność, tym razem również na to robimy największy nacisk.

P.P.S. Ostatnie szlify agendy kursu! Zbieram informację zwrotną i skupiam się na tym, co najistotniejsze i najbardziej wartościowe z dużym naciskiem na praktyczność.

🎙️BM130: LangChain, RAG i wektorowe bazy: ciemna strona prototypowania AI. 👉 https://www.youtube.com/watch?v=7SWnHtGgDw8...
09/10/2024

🎙️BM130: LangChain, RAG i wektorowe bazy: ciemna strona prototypowania AI.

👉 https://www.youtube.com/watch?v=7SWnHtGgDw8

Dzisiaj skupimy się na wdrażaniu ML na produkcję. Omówię trzy kluczowe kwestie:
1️⃣ Paradoks danych, zwykle zgadzamy się, że dane są ważne, ale często nie poświęcamy im tyle uwagi, ile potrzebują.
2️⃣ Przesadna koncentracja na narzędziach, owszem narzędzia są ważne, ale nie najważniejsze.
3️⃣ Cechy dobrego projektu na produkcję. Powinien być wiarygodny, kontrolowany, audytowalny i łatwy w naprawie błędów.

Opowiem Ci trzy historie projektów DataWorkshop, aby lepiej pobudzić Twoją wyobraźnie na przykładach. Pamiętaj, że w większości przypadków (80-90%) ML nie działa, ponieważ popełniane są podstawowe błędy. W przypadku LLM te problemy tylko się nasilają.

Historia pierwsza - "Mentor"
Organizacja zajmuje się mentoringiem w obszarze IT, skupiając się na wiedzy organizacyjnej, menedżerskiej i liderskiej. Obecnie zapraszani są eksperci, którzy prowadzą warsztaty. Są pewne wyzwania: ciężko jest to uspójnić, bo różni eksperci prezentują wiedzę w inny sposób i co jeszcze jest Trudności ze znalezieniem praktyków, bo znalezienie i zaangażowanie zapracowanych ekspertów jest trudne.
Pojawił się pomysł, aby ocyfrować wiedzę i częściowo zautomatyzować mentoring przy pomocy AI. Czy to w ogóle możliwe?

Historia druga - "Egzamin"
Drugi projekt nazwijmy "Egzamin". W szkole zawodowej uczniowie zdają egzaminy, aby zdobyć kwalifikacje. Celem projektu jest stworzenie asystenta AI, który zdałby ten egzamin. Dlaczego to istotne? Zdając egzamin, asystent udowodniłby, że rozumie daną branżę. Można go by potem rozwijać, aby podpowiadał i prognozował. Klasyczne uczenie maszynowe i LLM mogą tu współdziałać. LLM może posiadać ogólną wiedzę zdobytą w procesie uczenia, a klasyczne algorytmy ML mogą prognozować wartości, np. popyt.

Historia trzecia - "Helpdesk"
Trzecia projekt nazwijmy "Helpdesk", projekt, w którym zachowanie poufności jest kluczowe. Nie mogę zdradzać szczegółów branży. W skrócie, chodzi o wykorzystanie LLM do stworzenia chatbota obsługującego bazę wiedzy i odpowiadającego na pytania użytkowników.

Będzie więcej o czymś, co nazwałem jako paradoks danych.
Zwykle wszyscy zgadzają się, że dane są ważne, ale w praktyce rzadko poświęca się im wystarczającą uwagę. Nazywam to paradoksem danych. Zgoda na to, że dane są ważne, nie wystarczy. Potrzebne są konkretne działania. Bez jasnych reguł zarządzania jakością danych, wdrożenie ML jest skazane na porażkę.

Na koniec odcinka też odpowiadam na pytania:
1. Jakie są najczęstsze błędy firm, które próbują wdrożyć AI (główny mit)?
2. Jakie są największe wyzwania związane z modelami LLM przy wdrażaniu je na produkcję?
3. Jakie praktyczne wskazówki mam dla Ciebie, aby wdrożyć AI w swojej firmie?

Own your AI, not just its outputs! The main question is: What do you control when using closed LLM models like OpenAI, A...
08/10/2024

Own your AI, not just its outputs! The main question is: What do you control when using closed LLM models like OpenAI, Anthropic, or Gemini? 🤔

Answer: You have virtually no control and it's almost certainly a vendor lock-in for your business... or is it?

Usually closed models means that you're:
--> locked into their rules
--> renting AI, not owning AI
--> limited in terms of auditability
--> at risk of data privacy concerns
--> facing compliance challenges (GDPR, HIPAA, EU ACT...)
--> your business becomes dependent on their decisions and pricing

This is a risky gamble, isn't it?

Open (weight) models might require more tuning and resources to achieve the same level of performance (tailored to your specific business problems) as closed models, but they offer greater flexibility and control.

To be clear, I'm not saying you shouldn't use OpenAI (or other closed models) at all. I often use closed models for prototyping. They're great for quick results, but consider the risks before going into production.

GPT (and other closed models) is impressive, but your business needs solutions, not popularity! Do you agree? Open LLMs offer custom solutions tailored to your data and needs, not just rented AI.

Important point: own your AI future. There are different options, but first, let's take this path and start considering possible approaches.

How do you manage this risk in production? Have you considered using open (weight) models in production?

Yesterday, I gave a talk at NVIDIA (with their office in the background).I talked about how you can run large language m...
26/09/2024

Yesterday, I gave a talk at NVIDIA (with their office in the background).
I talked about how you can run large language models (LLMs) on your own rules. To put it simply — how to run LLM models (kind of "ChatGPT") on your own server using open-weight (source) models like Llama, Mistral, Qwen and others.

The presentation was quite packed. I shared my own experiences, having struggled myself while structuring all the information. It’s a fresh and fragmented topic. Usually, there are two extremes: either people are deeply immersed in their niche (e.g. focus only on Managing the KV Cache) or they’re completely out of the loop.

So, when you want to dive into the subject and make an informed decision, it's not always easy. I came up with a basic algorithm for myself, consisting of at least 5 steps:
1. Hardware (Nvidia GPUs and others)
2. Software (inference tools)
3. LLM model
4. Optimization
5. API

Additionally, yesterday there were two other talks.

Prince Canuma gave an enthusiastic presentation promoting the "small models" approach and is deeply involved in open-source development. I learned about his library, FastMLX, which is definitely worth checking out. Not only is he doing great work, but his positive attitude and energy are truly infectious!

Mateusz Szczęsny from Nvidia spoke about NIM, explaining how it works, its architecture, and the core concepts. In short, it's an Nvidia product based on microservices, utilizing various components to enable running LLMs (including vLLM and TensorRT-LLM). Their focus is on making it easy for others to use.

Last, but not least! Big thanks for NVIDIA (for hosting us), and of course Agnieszka Rybak and Tomasz Sienkiewicz for inviting me and organizing this great event. Good job! I know how much effort it takes to make things happen—bravo! 👏👏👏

P.S. By the way, have you subscribed to my podcast about AI (Biznes Myśli in Polish)? I share a lot of practical insights related to AI (ML/LLM).
https://www.youtube.com/playlist?list=PLWOCRT27Z94XZzwcRI9-ExMyUXeBrF3W_

P.P.S. Follow me, like, and share this post. This motivates me to keep sharing my experience with you. Thanks!

Zrozum inferencję modeli LLM! Nowy odcinek podcastu Biznes Myśli dzielę się praktycznymi zagadnieniami związanymi z LLM,...
25/09/2024

Zrozum inferencję modeli LLM! Nowy odcinek podcastu Biznes Myśli dzielę się praktycznymi zagadnieniami związanymi z LLM, doborem sprzętu, kwantyzacją i nie tylko. Dodatkowo, przygotowałem dla Ciebie bonus – szczegółową mapę myśli do pobrania!

🎙️ Ostatnio o LLM w BM jest najwięcej. W jednym z odcinków pokazałem, jak uruchomić lokalnie model Bielik. W komentarzach na YouTube pojawiają się pytania o to, jak profesjonalnie podejść do inferencji LLM, w tym:
👉 Ile GPU potrzebnych jest do uruchomienia modelu Llama 8B czy 400B?
👉Co zrobić, jeśli mamy więcej niż jednego użytkownika?
👉W najnowszym odcinku przeprowadzam Was przez kluczowe warstwy, aby pomóc w podejmowaniu świadomych decyzji.

👀 Oglądaj teraz na YouTube! 👀
https://www.youtube.com/watch?v=_OKLzmaSmg0

W tym odcinku znajdziesz odpowiedzi na pytania takie jak:
👉 Czym jest inferencja modeli LLM i jakie są kluczowe wymagania sprzętowe?
👉Jakie opcje dostępu do mocy obliczeniowej są dostępne i jakie mają zalety?
👉Jakie są różnice między zamkniętymi a otwartymi modelami AI?
👉Ile RAMu potrzebuje DUŻY model językowy?
👉Jakie są kluczowe parametry GPU i ich znaczenie?
👉Czy NVIDIA to jedyny wybór sprzętowy? Poznaj alternatywy!
👉Czym jest kwantyzacja modeli LLM i jak wpływa na ich wydajność?

Dodatkowo, opowiadam historię o tym, jak Elon Musk zorganizował serwerownię z 100 tys. kart H100 w rekordowym czasie oraz rozważam, czy GPT-4 to rewolucja, czy ewolucja.

Pobierz mapę myśli – znajdziesz ją w opisie odcinka. To może być wartościowe narzędzie dla Ciebie!

Powiedz czy masz w planach też uruchomić model LLM?

P.S. Obserwuj mnie, postaw like I podziel się z innymi, to mnie motywuję, aby dzielić się jeszcze więcej z Tobą praktyczną wiedzą o ML.

Adres

Kraków
30-024 TO 31–962

Strona Internetowa

Ostrzeżenia

Bądź na bieżąco i daj nam wysłać e-mail, gdy DataWorkshop umieści wiadomości i promocje. Twój adres e-mail nie zostanie wykorzystany do żadnego innego celu i możesz zrezygnować z subskrypcji w dowolnym momencie.

Skontaktuj Się Z Firmę

Wyślij wiadomość do DataWorkshop:

Udostępnij