Apps in diesem Workflow

Wie es funktioniert

Erstelle in einer Minute deinen automatisierten pdf-to-Text-Extraktor! Die perfekte Lösung für alle, die mit großen Mengen an eingehenden Lebensläufen oder anderen Dokumenten zu tun haben! Extrahiere Daten aus Dokumenten mit Hilfe des Remote-Workflows auf Latenode.com!


In diesem Artikel erfährst du, wie du einen automatisierten Arbeitsablauf ohne Code erstellst, der mithilfe von API und Chat GPT Daten aus den PDF-Dateien in deinem Google Drive extrahiert und das Google Sheet-Formular mit den Daten füllt.

Außerdem bekommst du die Vorlage für dieses Szenario, die du kostenlos kopieren und für dich verwenden kannst! 

Du kannst diese Vorlage erweitern oder sie nicht nur für die PDF-Textextraktion verwenden.

Szenario-Übersicht

Schauen wir uns zunächst das gesamte Szenario des pdf scrapers an und schlüsseln dann jeden Schritt auf.

Illustration der Szenarioübersicht auf Latenode

Wie funktioniert dieses pdf-Extraktionsszenario? Einmal in der Stunde werden alle Lebensläufe im PDF-Format aus dem Google Drive geholt, per HTTP-Request in txt-Dateien umgewandelt, dann extrahiert der chatGPT-Assistent die benötigten Daten und füllt das Google Spreadsheet aus.

Die wichtigsten Schritte des Szenarios:

  1. Zeitplan-Auslöser. Aktiviert das Szenario zu einem bestimmten Zeitpunkt.
  2. Google Drive. Hier haben wir 2 Knotenpunkte: Datei suchen und Datei herunterladen.
  3. Javascript. Wir werden während des gesamten Szenarios Javascript-Knoten mit AI Copilot für die Dateiformatierung verwenden. Zuerst habe ich AI gebeten, mir einen Code zu geben, der Dateien von Google Drive in das base64-Format umwandelt.
  4. HTTP-Anfrage. Verwende die API, um Text aus einer PDF-Datei zu extrahieren, indem du die API-Dokumente des Anbieters verwendest.
  5. ChatGPT. Der ChatGPT-Assistent extrahiert die Daten aus dem Text.
  6. Google Sheets. Füllt das Blatt mit diesen Informationen aus,

Aufschlüsselung der Szenarien

Und hier ist eine Schritt-für-Schritt-Anleitung für alle, die den Prozess lernen wollen. Vergiss nicht die kostenlosen und sofort einsetzbaren Vorlagen am Ende des Artikels.

Vorbereitungen

Für dieses Szenario musst du die Möglichkeit haben, Open AI Assistants und jeden API-Konverter zu nutzen.

OpenAI Assistent

Das ist ganz einfach. Logge dich in dein OpenAI-Konto ein und gehe dann zu Assistentenund klicke auf die Schaltfläche "Erstellen" in der oberen rechten Ecke. Dann siehst du das Einstellungsfeld für den Assistenten.

Illustration der KI-Assistenten-Rechtseinstellungen

Das musst du tun:

  1. Gib deinem Assistenten einen Namen
  2. Gib ihm Anweisungen, wie es antworten soll, und etwas Kontext. Wir empfehlen, dass du ihn bittest, angehängte Dateien zu verwenden, denn sonst kann er es vergessen.
  3. Wähle ein Modell
  4. Wähle die verfügbaren Werkzeuge aus und füge Dateien hinzu, die der Assistent verwenden kann. Vergiss nicht, den Abruf zu aktivieren, um das Hinzufügen von Dateien zu ermöglichen.

Kopiere die ID des Assistenten (du siehst sie unter der Spalte Name), dann gehe zu API-Schlüssel, erstelle einen und speichere ihn.

PDF zu TXT Konverter

Nimm eine, die du magst. Ich habe mich für ConvertAPI entschieden, weil es eine kostenlose Testversion gibt und eine Menge Informationen liefert.

Illustration der ConvertAPI-App zur Erstellung eines automatischen Konverters von PDF zu Text

Szenario erstellen

Jetzt wechseln wir zu Latenode.com. Hier müssen wir das Szenario für die Umwandlung von PDF in Text erstellen: (Du musst es nicht von Grund auf neu erstellen, kopiere einfach die Vorlage am Ende des Artikels)

Zeitplan Auslöser

Illustration des Zeitplanauslösers

Klicke in der Registerkarte "Szenario" auf "Knoten hinzufügen" und wähle "Zeitplan" aus der Liste. Klicke auf den Knoten, um ihn einzurichten. Lege das Intervall und die Zeitzone fest und speichere die Änderungen. Der Einfachheit halber habe ich auch einen Auslöser für "Einmal ausführen" hinzugefügt.

Google Drive Knotenpunkte

Illustration der Google Drive Knotenpunkte

Klicken Sie auf "Knoten hinzufügen", suchen Sie auf der Registerkarte "Aktionen" nach dem Ordner "Google-Laufwerk" und wählen Sie den Knoten "Datei suchen".
Damit das funktioniert, müssen Sie sich bei Ihrem Google Mail-Konto anmelden, um das Zugriffstoken zu erhalten, das Laufwerk auswählen und den Namen suchen. In diesem Fall möchte ich Daten aus Dateien extrahieren, die CV in ihrem Namen haben.

Füge als Nächstes "Datei herunterladen" aus demselben Aktionsordner von Google Drive hinzu.

Veranschaulichung, wie du die Datei herunterlädst, die du brauchst, um den AI pdf-text converter zu erstellen

Verwende die id aus den Ergebnissen des vorherigen Knotens und klicke dann einmal auf run node, um die Änderungen zu speichern und die Daten durch das Szenario fließen zu lassen. Du erhältst die Datei in der Ausgabe.

Javascript #1: In base64 umwandeln

Illustration des JS-Codes, den du brauchst Um Text zu extrahieren

Das ist der Code, den die KI mir gegeben hat. Du kannst ihn hier übernehmen (#1). Ersetze const fileContentPath durch dein Objekt aus dem vorherigen Knoten.

HTTP-Anfrage

Finde die HTTP-Anfrage in der Liste der Aktionen. Wie du sie erstellst, erfährst du in der ConvertAPI-Dokumentation. Hier erfährst du, wie du die Anfrage einrichtest.

So sieht meine Anfrage zur Umwandlung von pdf in txt aus.

Illustration der richtigen HTTP-Request-Einstellungen

Ich verwende ein Objekt aus dem Knoten Find file Google Drive, um den Namen der heruntergeladenen Datei anzugeben, und den Dateiinhalt in base64 aus dem Javascript-Knoten. Und füge das Paar Content-Type=application/json in die Header ein.

Illustration der richtigen HTTP-Request-Einstellungen

Führe node einmal aus, um die Datei von der HTTP-Anfrage zu erhalten.

Javascript #2

Illustration des JS-Codes, den du brauchst Um Text zu extrahieren

Ein weiterer Code-Knoten, #2 hier.

Dieses Mal habe ich AI gebeten, Text aus der txt-Datei zu extrahieren.

ChatGPT-Knoten

Wir werden hier mit 3 GPT-Knoten konfrontiert:

  • Thema erstellen
  • Nachricht erstellen
  • Lauf erstellen

 Jeder Knotenpunkt führt eine Aktion mit OpenAI durch.

Zuerst erstellen wir einen Thread oder eine Unterhaltung mit dem GPT-Assistenten

Illustration, wie man ChatGPT-Knoten erstellt und wie man den AP-Schlüssel verwendet

Gib deinen Open AI API-Schlüssel ein, das war's! Führe node einmal aus und erhalte die ID des erstellten Threads in der Ausgabe.

Nachricht erstellen:

Illustration, wie man die richtige Massage für den KI-Support-Assistenten erstellt

Hier brauchst du wieder einen API-Schlüssel. Gib in das Feld Thread-ID das Ergebnis des vorherigen Knotens ein. Du wirst es im Hilfsfenster sehen, nachdem du auf das Eingabefeld geklickt hast.

Gib unter "Nachrichteninhalt" einige zusätzliche Anweisungen ein, wenn du willst, und füge den Dateiinhalt aus dem letzten Javascript-Knoten ein. Der automatisierte PDF-Extraktor ist einen Schritt näher!

Lauf erstellen

Illustration Wie du deinen Lauf erstellst, um das Ergebnis zu sehen

Dieser Knoten erhält die Antwort des pdf scrapers.

Gib den Knotenpunkt genau wie deinen OpenAI-Assistenten an und verwende die GPT-Assistenten-ID.

Javascript #3

Illustration des JS-Codes, den du brauchst Um Text zu extrahieren

Hier verwenden wir das letzte Mal JS Node, um aus der Antwort des Assistenten 3 separate json-Objekte zu machen.

Hier ist das Beispiel, füge einfach deine Daten in content const ein.

Google Sheets

Lass uns diese Daten irgendwo ablegen. Google Sheets ist eine gute Option für dieses Szenario des pdf-Datenauszugs auf latenode. com.

Illustration der Google Sheets-Einstellungen, die du brauchst

Melde dich noch einmal bei deinem Google Mail-Konto an, um ein Zugriffstoken zu erhalten, wähle das Laufwerk und das Blatt aus und trage jsons in die Felder ein, speichere das Szenario und klicke einmal auf Ausführen, um das Szenario auszuführen oder zu verteilen, um den Zeitplanauslöser zu aktivieren.

Ergebnisse

Die Ergebnisse der Arbeit, die wir geleistet haben

Nach erfolgreicher Ausführung des Szenarios extrahiert dieser Workflow den Text aus der PDF-Datei auf deinem Google Drive und fügt ihn in dein Google Spreadsheet ein.

So erstellst du einen PDF-Extraktor ohne Code auf latenode.

Wie versprochen, hier ist die Vorlage für diesen Workflow. Kopiere sie einfach und folge diesem Artikel, um sie einzurichten.

Es gibt ein Video darüber, mach dir nicht die Mühe zu lesen!

Wenn du jemanden brauchst, der dir hilft, schau in unserem Discord-Kanal vorbei. Wir haben dort einige Entwickler, die dir helfen können!

Kategorien

AI
IT & Entwicklung
Werbung & Marketing

FAQ

Kann ich Latenode nutzen, wenn ich mich nicht mit der Programmierung auskenne?

Ja, Latenode ist für Benutzer aller Fähigkeitsstufen gedacht. Es bietet fortgeschrittene Funktionen für diejenigen, die JavaScript beherrschen, und intuitive visuelle Werkzeuge und KI-Hilfe für Anfänger. Egal, ob du ein erfahrener Entwickler oder ein Anfänger bist, Latenode bietet dir eine benutzerfreundliche Erfahrung, die auf deine Fähigkeiten zugeschnitten ist.‍‍

Kann Latenode mit Diensten und APIs von Drittanbietern integriert werden?

Ja, Latenode unterstützt die Integration mit einer Vielzahl von Drittanbieterdiensten und APIs. Du kannst Latenode mit verschiedenen Online-Plattformen, Datenbanken und Softwaresystemen verbinden, um Datenübertragungen zu automatisieren, Aktionen auszulösen und Arbeitsabläufe zu optimieren. Latenode bietet außerdem Tools und Ressourcen, um den Integrationsprozess zu erleichtern.

Gibt es eine kostenlose Version von Latenode ?

Ja, Latenode bietet eine kostenlose Version an, mit der du seine Möglichkeiten kennenlernen kannst. Diese Version enthält eine Teilmenge der Funktionen von Latenode und ermöglicht es dir, mit der Automatisierung zu beginnen und ihre Vorteile zu erleben. Du kannst dann entscheiden, ob du auf einen kostenpflichtigen Plan für zusätzliche Funktionen und Ressourcen umsteigen möchtest.

Was ist Latenode?

Latenode ist ein übersichtliches und intuitives Automatisierungstool, mit dem Kunden ihre Arbeitsabläufe durch Automatisierung rationalisieren können. Es ermöglicht Kunden, computerisierte Strategien zu erstellen, indem sie verschiedene Internetangebote und Gadgets miteinander verbinden.

Wie hilft Latenode dabei, die Chancen zu maximieren?

Indem du alle deine Marketinginstrumente durch Datenintegration an einem Ort zusammenfasst, hilft dir Latenode , einen umfassenden Überblick über deine Aktivitäten zu gewinnen. So kannst du potenzielle Chancen leichter erkennen und fundierte Entscheidungen auf der Grundlage genauer Daten treffen.