PREISGEBUNG
PRODUKT
LÖSUNGEN
nach Anwendungsfall
mehr lernen
BlogSchablonenVideosYoutubeRESSOURCEN
GEMEINSCHAFTEN UND SOZIALE MEDIEN
PARTNER
Mit unserem Produkt können Nutzer ihren Arbeitsablauf optimieren und in wenigen Minuten effizient Text aus PDFs extrahieren. Unser automatisiertes System macht die manuelle Dateneingabe überflüssig, reduziert das Fehlerrisiko und steigert die Produktivität. Mit nur wenigen Klicks können Nutzer/innen Text aus mehreren PDF-Dateien gleichzeitig extrahieren, was es zu einem wertvollen Werkzeug für Unternehmen und Einzelpersonen macht.
Erstelle in einer Minute deinen automatisierten pdf-to-Text-Extraktor! Die perfekte Lösung für alle, die mit großen Mengen an eingehenden Lebensläufen oder anderen Dokumenten zu tun haben! Extrahiere Daten aus Dokumenten mit Hilfe des Remote-Workflows auf Latenode.com!
In diesem Artikel erfährst du, wie du einen automatisierten Arbeitsablauf ohne Code erstellst, der mithilfe von API und Chat GPT Daten aus den PDF-Dateien in deinem Google Drive extrahiert und das Google Sheet-Formular mit den Daten füllt.
Außerdem bekommst du die Vorlage für dieses Szenario, die du kostenlos kopieren und für dich verwenden kannst!
Du kannst diese Vorlage erweitern oder sie nicht nur für die PDF-Textextraktion verwenden.
Schauen wir uns zunächst das gesamte Szenario des pdf scrapers an und schlüsseln dann jeden Schritt auf.
Wie funktioniert dieses pdf-Extraktionsszenario? Einmal in der Stunde werden alle Lebensläufe im PDF-Format aus dem Google Drive geholt, per HTTP-Request in txt-Dateien umgewandelt, dann extrahiert der chatGPT-Assistent die benötigten Daten und füllt das Google Spreadsheet aus.
Und hier ist eine Schritt-für-Schritt-Anleitung für alle, die den Prozess lernen wollen. Vergiss nicht die kostenlosen und sofort einsetzbaren Vorlagen am Ende des Artikels.
Für dieses Szenario musst du die Möglichkeit haben, Open AI Assistants und jeden API-Konverter zu nutzen.
Das ist ganz einfach. Logge dich in dein OpenAI-Konto ein und gehe dann zu Assistentenund klicke auf die Schaltfläche "Erstellen" in der oberen rechten Ecke. Dann siehst du das Einstellungsfeld für den Assistenten.
Das musst du tun:
Kopiere die ID des Assistenten (du siehst sie unter der Spalte Name), dann gehe zu API-Schlüssel, erstelle einen und speichere ihn.
Nimm eine, die du magst. Ich habe mich für ConvertAPI entschieden, weil es eine kostenlose Testversion gibt und eine Menge Informationen liefert.
Jetzt wechseln wir zu Latenode.com. Hier müssen wir das Szenario für die Umwandlung von PDF in Text erstellen: (Du musst es nicht von Grund auf neu erstellen, kopiere einfach die Vorlage am Ende des Artikels)
Klicke in der Registerkarte "Szenario" auf "Knoten hinzufügen" und wähle "Zeitplan" aus der Liste. Klicke auf den Knoten, um ihn einzurichten. Lege das Intervall und die Zeitzone fest und speichere die Änderungen. Der Einfachheit halber habe ich auch einen Auslöser für "Einmal ausführen" hinzugefügt.
Klicken Sie auf "Knoten hinzufügen", suchen Sie auf der Registerkarte "Aktionen" nach dem Ordner "Google-Laufwerk" und wählen Sie den Knoten "Datei suchen".
Damit das funktioniert, müssen Sie sich bei Ihrem Google Mail-Konto anmelden, um das Zugriffstoken zu erhalten, das Laufwerk auswählen und den Namen suchen. In diesem Fall möchte ich Daten aus Dateien extrahieren, die CV in ihrem Namen haben.
Füge als Nächstes "Datei herunterladen" aus demselben Aktionsordner von Google Drive hinzu.
Verwende die id aus den Ergebnissen des vorherigen Knotens und klicke dann einmal auf run node, um die Änderungen zu speichern und die Daten durch das Szenario fließen zu lassen. Du erhältst die Datei in der Ausgabe.
Das ist der Code, den die KI mir gegeben hat. Du kannst ihn hier übernehmen (#1). Ersetze const fileContentPath durch dein Objekt aus dem vorherigen Knoten.
Finde die HTTP-Anfrage in der Liste der Aktionen. Wie du sie erstellst, erfährst du in der ConvertAPI-Dokumentation. Hier erfährst du, wie du die Anfrage einrichtest.
So sieht meine Anfrage zur Umwandlung von pdf in txt aus.
Ich verwende ein Objekt aus dem Knoten Find file Google Drive, um den Namen der heruntergeladenen Datei anzugeben, und den Dateiinhalt in base64 aus dem Javascript-Knoten. Und füge das Paar Content-Type=application/json in die Header ein.
Führe node einmal aus, um die Datei von der HTTP-Anfrage zu erhalten.
Ein weiterer Code-Knoten, #2 hier.
Dieses Mal habe ich AI gebeten, Text aus der txt-Datei zu extrahieren.
Wir werden hier mit 3 GPT-Knoten konfrontiert:
Jeder Knotenpunkt führt eine Aktion mit OpenAI durch.
Zuerst erstellen wir einen Thread oder eine Unterhaltung mit dem GPT-Assistenten
Gib deinen Open AI API-Schlüssel ein, das war's! Führe node einmal aus und erhalte die ID des erstellten Threads in der Ausgabe.
Hier brauchst du wieder einen API-Schlüssel. Gib in das Feld Thread-ID das Ergebnis des vorherigen Knotens ein. Du wirst es im Hilfsfenster sehen, nachdem du auf das Eingabefeld geklickt hast.
Gib unter "Nachrichteninhalt" einige zusätzliche Anweisungen ein, wenn du willst, und füge den Dateiinhalt aus dem letzten Javascript-Knoten ein. Der automatisierte PDF-Extraktor ist einen Schritt näher!
Dieser Knoten erhält die Antwort des pdf scrapers.
Gib den Knotenpunkt genau wie deinen OpenAI-Assistenten an und verwende die GPT-Assistenten-ID.
Hier verwenden wir das letzte Mal JS Node, um aus der Antwort des Assistenten 3 separate json-Objekte zu machen.
Hier ist das Beispiel, füge einfach deine Daten in content const ein.
Lass uns diese Daten irgendwo ablegen. Google Sheets ist eine gute Option für dieses Szenario des pdf-Datenauszugs auf latenode. com.
Melde dich noch einmal bei deinem Google Mail-Konto an, um ein Zugriffstoken zu erhalten, wähle das Laufwerk und das Blatt aus und trage jsons in die Felder ein, speichere das Szenario und klicke einmal auf Ausführen, um das Szenario auszuführen oder zu verteilen, um den Zeitplanauslöser zu aktivieren.
Nach erfolgreicher Ausführung des Szenarios extrahiert dieser Workflow den Text aus der PDF-Datei auf deinem Google Drive und fügt ihn in dein Google Spreadsheet ein.
So erstellst du einen PDF-Extraktor ohne Code auf latenode.
Wie versprochen, hier ist die Vorlage für diesen Workflow. Kopiere sie einfach und folge diesem Artikel, um sie einzurichten.
Es gibt ein Video darüber, mach dir nicht die Mühe zu lesen!
Wenn du jemanden brauchst, der dir hilft, schau in unserem Discord-Kanal vorbei. Wir haben dort einige Entwickler, die dir helfen können!
Ja, Latenode ist für Benutzer aller Fähigkeitsstufen gedacht. Es bietet fortgeschrittene Funktionen für diejenigen, die JavaScript beherrschen, und intuitive visuelle Werkzeuge und KI-Hilfe für Anfänger. Egal, ob du ein erfahrener Entwickler oder ein Anfänger bist, Latenode bietet dir eine benutzerfreundliche Erfahrung, die auf deine Fähigkeiten zugeschnitten ist.
Ja, Latenode unterstützt die Integration mit einer Vielzahl von Drittanbieterdiensten und APIs. Du kannst Latenode mit verschiedenen Online-Plattformen, Datenbanken und Softwaresystemen verbinden, um Datenübertragungen zu automatisieren, Aktionen auszulösen und Arbeitsabläufe zu optimieren. Latenode bietet außerdem Tools und Ressourcen, um den Integrationsprozess zu erleichtern.
Ja, Latenode bietet eine kostenlose Version an, mit der du seine Möglichkeiten kennenlernen kannst. Diese Version enthält eine Teilmenge der Funktionen von Latenode und ermöglicht es dir, mit der Automatisierung zu beginnen und ihre Vorteile zu erleben. Du kannst dann entscheiden, ob du auf einen kostenpflichtigen Plan für zusätzliche Funktionen und Ressourcen umsteigen möchtest.
Latenode ist ein übersichtliches und intuitives Automatisierungstool, mit dem Kunden ihre Arbeitsabläufe durch Automatisierung rationalisieren können. Es ermöglicht Kunden, computerisierte Strategien zu erstellen, indem sie verschiedene Internetangebote und Gadgets miteinander verbinden.
Indem du alle deine Marketinginstrumente durch Datenintegration an einem Ort zusammenfasst, hilft dir Latenode , einen umfassenden Überblick über deine Aktivitäten zu gewinnen. So kannst du potenzielle Chancen leichter erkennen und fundierte Entscheidungen auf der Grundlage genauer Daten treffen.