Ekstrakcja tekstu z obrazu przy użyciu AI jest wartościowa, ponieważ nie wymaga kodowania. Wykorzystuje model Google Gemini 2.0 Flash do wydobywania istotnych informacji z obrazu. Bez AI konieczne byłoby użycie wielu warunków, co mogłoby prowadzić do błędów. Dzięki Google Gemini proces jest prostszy - nawet jeśli format Pay Slip się zmieni, Gemini automatycznie wyodrębni potrzebne dane.
Użytkownik wysyła obraz Pay Slip lub wiadomość przez Line Messaging API do chatbota. Najpierw należy utworzyć Line Business ID. System klasyfikuje wiadomość jako obraz lub tekst.
Jeśli wiadomość zawiera obraz Pay Slip:
Klucz API Google AI Studio można uzyskać z oficjalnej strony. Należy również utworzyć arkusz Google Sheets z polami odpowiadającymi promptowi AI (Status, From, To, Date, Amount).
Dla wiadomości tekstowych:
Ta automatyzacja znajduje zastosowanie w wielu scenariuszach biznesowych i administracyjnych, szczególnie tam, gdzie konieczne jest przetwarzanie dokumentów w formie graficznej. Oto kilka potencjalnych zastosowań:
Możesz dostosować przetwarzane informacje poprzez modyfikację promptu oraz nazw kolumn w Google Sheets. Automatyzacja jest elastyczna i może być dostosowana do różnych typów dokumentów.