Przetwarzanie j - Onepress

Autor: Lewis Tunstall, Leandro von Werra, Thomas Wolf
Tytuł oryginału: Natural Language Processing with Transformers, Revised Edition
Tłumaczenie: Grzegorz Werner
ISBN: 978-83-289-0711-9
stron: 381, Format: 165x235, okładka: mi
Księgarnia: Onepress

Książka będzie dostępna od grudnia 2023

Zobacz także »

Tagi: Perswazja i NLP

Modele transformacyjne zmieni

Zobacz także:

MANIPULACJA ODCZAROWANA! 777 skutecznych technik wpływu. Wydanie 2 rozszerzone 47,78 zł, (12,90 zł -73%)
Sztuka podstępu. Łamałem ludzi, nie hasła. Wydanie II 44,48 zł, (12,90 zł -71%)
Socjotechnika. Sztuka zdobywania władzy nad umysłami. Wydanie II 44,84 zł, (13,90 zł -69%)
Zawód: copywriter. Zacznij zarabiać na pisaniu 39,09 zł, (12,90 zł -67%)
MANIPULACJA ODCZAROWANA! 777 skutecznych technik wpływu 39,09 zł, (12,90 zł -67%)

Słowo wstępne

Przedmowa

1. Witajcie, transformery

Model koder-dekoder
Mechanizmy atencji
Uczenie transferowe w NLP
Hugging Face Transformers - eliminowanie luki
Przegląd zastosowań transformerów
- Klasyfikacja tekstu
- Rozpoznawanie nazwanych encji
- Odpowiadanie na pytania
- Streszczanie
- Tłumaczenie
- Generowanie tekstu
Ekosystem Hugging Face
- Hugging Face Hub
- Hugging Face Tokenizers
- Hugging Face Datasets
- Hugging Face Accelerate
Główne wyzwania związane z transformerami
Podsumowanie

2. Klasyfikacja tekstu

Zbiór danych
- Pierwsze spojrzenie na zbiory danych Hugging Face
- Od zbiorów do ramek danych
- Sprawdzanie rozkładu klas
- Jak długie są nasze tweety?
Od tekstu do tokenów
- Tokenizacja znakowa
- Tokenizacja wyrazowa
- Tokenizacja podwyrazowa
- Tokenizacja całego zbioru danych
Trenowanie klasyfikatora tekstu
- Transformery jako ekstraktory cech
- Dostrajanie transformerów
Podsumowanie

3. Anatomia transformera

Architektura transformera
Koder
- Samouwaga
- Warstwa propagacji w przód
- Dodawanie normalizacji warstw
- Osadzenia pozycyjne
- Dodawanie głowy klasyfikacyjnej
Dekoder
Poznaj transformery
- Drzewo życia transformerów
- Gałąź koderów
- Gałąź dekoderów
- Gałąź koderów-dekoderów
Podsumowanie

4. Wielojęzyczne rozpoznawanie nazwanych encji

Zbiór danych
Transformery wielojęzyczne
Bliższe spojrzenie na tokenizację
- Potok tokenizatora
- Tokenizator SentencePiece
Transformery w rozpoznawaniu nazwanych encji
Anatomia klasy modelu transformera
- Ciała i głowy
- Tworzenie niestandardowego modelu do klasyfikacji tokenów
- Wczytywanie niestandardowego modelu
Tokenizacja tekstów na użytek NER
Miary efektywności
Dostrajanie modelu XLM-RoBERTa
Analiza błędów
Transfer międzyjęzykowy
- Kiedy transfer zero-shot ma sens?
- Dostrajanie na wielu językach jednocześnie
Interaktywne używanie widgetów modelu
Podsumowanie

5. Generowanie tekstu

6. Streszczanie

Zbiór danych CNN/DailyMail
Potoki streszczania tekstu
- Punkt odniesienia
- GPT-2
- T5
- BART
- PEGASUS
Porównanie różnych streszczeń
Mierzenie jakości generowanego tekstu
- BLEU
- ROUGE
Ewaluacja PEGASUS-a na zbiorze danych CNN/DailyMail
Trenowanie modelu streszczania
- Ewaluacja PEGASUS-a na zbiorze SAMSum
- Dostrajanie PEGASUS-a
- Generowanie streszczeń dialogów
Podsumowanie

7. Odpowiadanie na pytania

Budowanie systemu QA opartego na recenzjach
- Zbiór danych
- Wyodrębnianie odpowiedzi z tekstu
- Budowanie potoku QA z wykorzystaniem biblioteki Haystack
Ulepszanie potoku QA
- Ewaluacja modułu wyszukującego
- Ewaluacja modułu czytającego
- Adaptacja dziedzinowa
- Ewaluacja całego potoku QA
Wykraczanie poza ekstrakcyjne QA
Podsumowanie

8. Zwiększanie wydajności transformerów w środowisku produkcyjnym

Wykrywanie intencji jako studium przypadku
Tworzenie testu porównawczego
Zmniejszanie modeli poprzez destylację wiedzy
- Destylacja wiedzy na użytek dostrajania
- Destylacja wiedzy na użytek treningu wstępnego
- Tworzenie trenera do destylacji wiedzy
- Wybór dobrej inicjalizacji ucznia
- Znajdowanie dobrych parametrów za pomocą Optuny
- Testowanie wydestylowanego modelu
Przyspieszanie modeli za pomocą kwantyzacji
Testowanie skwantyzowanego modelu
Optymalizowanie inferencji za pomocą standardu ONNX i platformy ONNX Runtime
Rozrzedzanie modeli poprzez redukcję wag
- Rozrzedzanie w głębokich sieciach neuronowych
- Metody redukcji wag
Podsumowanie

9. Jak radzić sobie z nielicznymi etykietami lub brakiem etykiet

Budowanie narzędzia do tagowania problemów na GitHubie
- Pozyskiwanie danych
- Przygotowywanie danych
- Tworzenie zbiorów treningowych
- Tworzenie wycinków treningowych
Naiwny klasyfikator bayesowski jako model odniesienia
Praca bez etykiet
Praca z nielicznymi etykietami
- Wzbogacanie danych
- Używanie osadzeń jako tabeli wyszukiwania
- Dostrajanie standardowego transformera
- Uczenie kontekstowe i few-shot z podpowiedziami
Wykorzystywanie danych bez etykiet
- Dostrajanie modelu językowego
- Dostrajanie klasyfikatora
- Metody zaawansowane
Podsumowanie

10. Trenowanie transformerów od podstaw

Duże zbiory danych i gdzie ich szukać
- Wyzwania związane z budowaniem dużego korpusu
- Budowanie własnego zbioru danych z kodem
- Praca z dużymi zbiorami danych
- Dodawanie zbiorów danych do witryny Hugging Face Hub
Budowanie tokenizatora
- Model tokenizatora
- Mierzenie efektywności tokenizatora
- Tokenizator dla Pythona
- Trenowanie tokenizatora
- Zapisywanie niestandardowego tokenizatora w witrynie Hub
Trenowanie modelu od podstaw
- Opowieść o celach treningu wstępnego
- Inicjalizowanie modelu
- Implementowanie klasy do wczytywania danych
- Definiowanie pętli treningowej
- Przebieg treningowy
Wyniki i analiza
Podsumowanie

11. Przyszłe kierunki