Automatyzacja napisów, czyli tworzenie opisu językowego obrazu z wykorzystaniem dowolnego przetwarzania w języku naturalnym jest trudnym zadaniem. Wymaga ono dobrej chwytności zarówno w przetwarzaniu obrazu, jak i w przetwarzaniu języka naturalnego. W tej książce omówiono różne dostępne techniki, które można wykorzystac do stworzenia opisu obrazu. Postęp technologiczny w zakresie rozpoznawania obiektów i uczenia się maszynowego znacznie poprawil w ostatnich latach wydajnośc modelu podpisywania obrazów. Oprócz tego postaramy się podejśc do różnych technik i algorytmów w celu zbudowania tego modelu. Na koniec, ocena modelu odgrywa ważną rolę, która będzie przydatna do rozważenia, który algorytm najlepiej pasuje do scenariusza. Istnieją techniki, które mogą byc wykorzystane do oceny wydajności, takie jak matryca pomylki, f1-score, ale w tym przypadku dane są oparte na języku naturalnym tak, że istnieje pewien szczególny rodzaj technologii, które mogą byc wykorzystane, takich jak Microsoft COCO i Flickr30K.