Suchen, Finden, Sparen mit searchit
Effiziente Suche in allen Microsoft Office Dateiformaten, Outlook-Archiven im PST-Format, PDF Dateien, TXT-Files, TIFF-/TIF-Dateien, PNG-Files, AutoCAD- und DWG-Formaten, ZIP-, RAR- und 7z-Archiven, XML-Formaten und vielen weiteren!
Das Durchsuchen nahezu jedes Dateiformats ist eine der größten Stärken der Enterprise Search Lösung searchit. Im Gegensatz zur Suche im File Explorer kann der Dateiinhalt inklusive Metadaten aller indizierten Dateien durchsucht werden, sogar bei Formaten für Scans, Bilder oder CAD-Dateien. Finden Sie heraus, wie genau searchit Undurchsuchbares durchsuchbar macht und scrollen Sie durch die vollständige Liste aller unterstützten Dateiformate.
Wie werden Dateien in searchit durchsucht?
Als Enterprise Search Lösung ermöglicht searchit die umfassende Durchsuchung von Dateien durch intelligente Indexierung und Kategorisierung. Nutzer können schnell und effizient nach Inhalten in verschiedenen Formaten wie Dokumenten, E-Mails, Präsentationen und mehr suchen, um relevante Informationen zu finden und die Produktivität zu steigern.
Was sind MIME-Types?
MIME-Types (Multipurpose Internet Mail Extensions) sind Kennzeichnungen, die den Medientyp von Dateien im Internet definieren. Sie ermöglichen die korrekte Interpretation und Verarbeitung von Inhalten, indem sie den Servern und Browsern den Dateityp mitteilen.
Unterstützte Kategorien von Dateiformaten
Der Anwalt wühlt sich tagtäglich durch E-Mail-Archive, die Vorarbeiterin durch CAD-Dateien – das meist-genutzte Dateiformat ist sowohl Branchen- als auch Job-abhängig. searchits ständig wachsende Anzahl an Parsern ermöglicht das Durchsuchen in beinahe allen Datei-Kategorien.
HTML (Hypertext Markup Language)
Die lingua franca des Webs – Nahezu jedes auf dem Web gefunden HTML-Format wird mit der searchit Suchfunktion unterstützt:
- Gültigen XHTML-Code und XML
- Microsoft Office-Dokumentenformate
- OpenDocument
- iWorks
- Portable Document Formate
- EPUB
- RTF
- Komprimierungs- und Verpackungsformate
- Audio-, Bild- und Videoformate
- Und weitere wissenschaftliche, sprachverarbeitende, objekterkennende und datenbankbasierte Formate
XML und abgeleitete Formate
Das Extensible Markup Language (XML) Format wird sowohl für hierarchisch strukturierte Daten wie auch für einen plattformunabhängigen Austausch von Daten zwischen Computersystemen eingesetzt. Zu den von searchit unterstützten XML-Sprachen zählen:
- XHTML (Extensible Hypertext Markup Language)
- OOXML (Office Open XML)
- ODF (Open Document Format)
Microsoft Office-Dokumentformate
Text- und Metadatenextraktion aus Microsoft Office und einige verwandte Anwendungen können in den folgenden Formaten durchsucht werden:
- OLE 2 Compound Document Format
- OOXML (Office Open XML)
- Temporäre Office-Sperrdateien (Owner-Dateien)
OpenDocument-Format
searchit durchsucht das OpenDocument-Format (ODF) für:
- Alle Dateien der OpenOffice.org-Office-Suite
- Ältere Dateien im OpenOffice 1.0-Format, der Vorgänger von ODF
iWorks-Dokumentformate
Sowohl Text- als auch Metadaten werden in iWorks unterstützt, inklusive:
- Numbers
- Pages
- Keynotes
WordPerfect-Dokumentformate
searchit durchsucht alle Formate zugehörig zu:
- Corel WordPerfect Office Suite
- WordPerfect WP6+-Dateien
- QuattroPro QPW v9+-Dateien
Portable Document Format
Digital erstellte und nicht-durchsuchbare Scans werden in searchit mittels der ORC-Funktionalität durchsuchbar gemacht. Mehr zur PDF-Suche mit searchit.
Electronic Publication Format
searchit durchsucht eBooks, digitale Bücher und Paper in den den folgenden Formaten:
- Electronic Publication Format (EPUB)
- Fiction Book Publishing Format
Rich Text Format
Volle Suchfunktionalität für Dokumente im Rich Text Format (RTF).
Komprimierung und Verpackungsformate
Enterprise Search Software searchit ermöglicht das Suchen selbst in komprimierten Daten. Verschiedene Kompressions- und Paketierungsformate werden unterstützt:
- Tar
- AR
- ARJ
- CPIO
- Dump
- Zip
- 7Zip
- Gzip
- BZip2
- XZ
- LZMA
- Z
- Pack200
- RAR
- AppleSingle- und
- AppleDouble-Dateien
Text-Formate
Das Extrahieren von Textinhalten aus einfachen Textdateien scheint eine einfache Aufgabe zu sein, bis man anfängt, an all die möglichen Zeichenkodierungen zu denken. searchit ist in der Lage die Zeichenkodierung eines Textdokuments automatisch zu erkennen.
Feed- und Syndication-Formate
Updates von Websites, Podcasts oder Newsartikeln – searchit unterstützt Syndikationsformate mit denen Nutzer immer am neuesten Stand bleiben:
- RSS Feed
- Atom Feed
- IPTC ANPA News Wire Feed Format
Hilfe-Formate
searchit durchsucht die Microsoft Hilfe-Dateien:
- CHM-Hilfeformat ( genannat Compiled HTML Help, auch Compressed HTML Help oder Compiled Help Module(s))
Video-Formate
Videoaufnahmen in den am meist-verbreiteten Formaten werden mit serachit mit Fokus auf Metadaten durchsucht:
- Flash-Videoformat
- MP4-Familie von Videoformaten inklusive MP4, Quicktime, 3GPP u.v.m.
- Ogg-Familie von Videoformaten
Java-Klassendateien und Archive
Klassennamen und Methodensignaturen werden in searchit in den folgenden Formaten durchsucht:
- Java-Klassendateien
- jar-Archive
Source Code
searchit durchsucht selbst Quellcode nach Inhalt und Metadaten:
- Java
- C
- C++ Groovy
- und weitere!
E-Mail-Formate
Das Durchsuchen von Mails und selbst E-Mail-Archiven macht searchit in den folgenden Formaten möglich:
- PST-E-Mail-Format, im Einsatz bei Microsoft Outlook Archiven
- MSG-E-Mail-Format, im Einsatz bei einzeln heruntergeladenen Outlook-Mails
- Microsoft TNEF (Transport Neutral Encoding Format, auch bekannt als Winmail.dat), von den meisten Microsoft E-Mail-Clients für E-Mail-Anhänge verwendet
- mbox-Format, weit-verbreitet bei E-Mail-Archiven und Unix-ähnlichen Mailboxen
- RFC 822-Format: Verwendet von vielen E-Mail-Clients in Archiven und Exporten
CAD-Formate
searchit durchsucht Metdaten von Dateien im DWG-CAD-Format.
Schriftformate
Selbst in Schrift-Dateien nach Metadaten suchen – searchit unterstützt:
- TrueType-Schriftformat
- Adobe Font Metrics-Dateien
Wissenschaftliche Formate
Viele der Programme, die spezifisch in der Wissenschaft angewendet werden, können mit searchit nach Metadaten und Inhalt durchsucht werden:
- GCMD Directory Interchange Format (DIF)
- GDAL
- ISO-19139-Dateiformat für georgraphische Informationen
- Grib
- HDF
- Familie der Dateiformate ISA-Tab (ISA Tools)
- NetCDF
- Matlab
Ausführbare Programme und Bibliotheken
Mit searchit werden Metadateninformationen über Plattformen, Architekturen und Typen aus einer Reihe von ausführbaren Formaten und Bibliotheken extrahiert und durchsucht:
- Windows-Executables
- Linux/BSD-Programmen und -Bibliotheken
- und viele weitere!
Krypto-Formate
Durch sichere Zugriffsregelungen und mittels spezieller Parser durchsucht searchit sogar verschlüsselte Nachrichten:
- PKCS7-signierte Nachrichten, ohne Informationen aus dem äußeren PKCS7-Wrapper
- Metadaten aus Time Stamped Data Envelope-Dateien (TSD)
- Gespeicherte Inhalte aus dem TSD-Wrapper
Datenbankformate
Mehrere Typen von Datenbanken können in searchit schnell und unkompliziert durchsucht werden:
- SQLite3-Dateien
- Microsoft Access-Datenbankdateien
- dBase-Dateien (dbf) inklusive dBase, FoxBASE, FoxPRO und Shapefile-Format von ESRI
Verarbeitung natürlicher Sprache
Künstliche Intelligenz kommt bei searchit z. B. mittels Natural Language Processing- sowie Named Entity Recognition-Frameworks zum Einsatz. Dies ermöglicht:
- Klassifizierung der Stimmung und emotionalen Ton eines Dokuments
- Extrahierung von Metadaten aus Volltext von Zeitschriftenpublikationen zu extrahieren.
Bild- und Video-Objekterkennung
Mehrere Objekterkennungs-Frameworks werden unterstützt, um den Inhalt von Bildern und Videos zu analysieren. searchit Instanzen werden dabei mit große Trainingsdatensätzen auf spezifische Anwendungsbereiche von Kunden trainiert.
Wissen was drinsteht - ohne Rücksicht auf's Dateiformat
Dank searchit können Sie auf einer zentralen Plattform in hunderten Dateiformaten gleichzeitig suchenVollständige Liste der durchsuchbaren MIME-Types
Über dreihundert Formate für Textdateien, Bilder und Scans, PDFs und vieles mehr werden in searchit unterstützt:
AppleSingleFileParse
- application/applefile
PListParser
- application/x-plist
- application/x-bplist-itunes
- application/x-bplist
- application/x-bplist-memgraph
- application/x-bplist-webarchive
ClassParser
- application/java-vm
AudioParser
- audio/vnd.wave
- audio/x-wav
- audio/basic
- audio/x-aiff
MidiParser
- application/x-midi
- audio/midi
SourceCodeParser
- text/x-c++src
- text/x-groovy
- text/x-java-source
Pkcs7Parser
- application/pkcs7-signature
- application/pkcs7-mime
TSDParser
- application/timestamped-data
TextAndCSVParser
- text/csv
- text/tsv
- text/plain
DBFParser
- application/x-dbf
DGN8Parser
- image/vnd.dgn; version=8
DIFParser
- application/dif+xml
DWGParser
EpubParser
- application/x-ibooks+zip
- application/epub+zip
ExecutableParser
- application/x-msdownload
- application/x-sharedlib
- application/x-elf
- application/x-object
- application/x-executable
- application/x-coredump
ExternalParser
- video/avi
- video/mpeg
- video/x-msvideo
- video/mp4
FeedParser
- application/atom+xml
- application/rss+xml
AdobeFontMetricParser
- application/x-font-adobe-metric
TrueTypeParser
- application/x-font-ttf
HtmlParser
- text/html
- application/vnd.wap.xhtml+xml
- application/x-asp
- application/xhtml+xml
HttpParser
- application/x-httpresponse
HwpV5Parser
- application/x-hwp-v5
BPGParser
- image/bpg
- image/x-bpg
HeifParser
- image/heic-sequence
- image/heif
- image/heic
- image/heif-sequence
ICNSParser
- image/icns
ImageParser
- image/png
- image/vnd.wap.wbmp
- image/x-jbig2
- image/bmp
- image/x-xcf
- image/gif
- image/x-icon
- image/x-ms-bmp
JXLParser
- image/jxl
JpegParser
- image/jpeg
PSDParser
- image/vnd.adobe.photoshop
TiffParser
WebPParser
- image/webp
IDMLParser
- application/vnd.adobe.indesign-idml-package
IptcAnpaParser
- text/vnd.iptc.anpa
IWorkPackageParser
- application/vnd.apple.keynote
- application/vnd.apple.iwork
- application/vnd.apple.numbers
- application/vnd.apple.pages
IWork13PackageParser
- application/vnd.apple.numbers.13
- application/vnd.apple.unknown.13
- application/vnd.apple.pages.13
- application/vnd.apple.keynote.13
IWork18PackageParser
- application/vnd.apple.pages.18
- application/vnd.apple.keynote.18
- application/vnd.apple.numbers.18
RFC822Parser
- message/rfc822
MatParser
- application/x-matlab-data
MboxParser
- application/mbox
EMFParser
- image/emf
JackcessParser
- application/x-msaccess
MSOwnerFileParser
OfficeParser
- application/x-tika-msoffice-embedded; format=ole10_native
- application/msword
- application/vnd.visio
- application/x-tika-ole-drm-encrypted
- application/vnd.ms-project
- application/x-tika-msworks-spreadsheet
- application/x-mspublisher
- application/vnd.ms-powerpoint
- application/x-tika-msoffice
- application/sldworks
- application/x-tika-ooxml-protected
- application/vnd.ms-excel
- application/vnd.ms-outlook
OldExcelParser
- application/vnd.ms-excel.workspace.3
- application/vnd.ms-excel.workspace.4
- application/vnd.ms-excel.sheet.2
- application/vnd.ms-excel.sheet.3
- application/vnd.ms-excel.sheet.4
TNEFParser
- application/vnd.ms-tnef
- application/x-tnef
- application/ms-tnef
WMFParser
- image/wmf
ActiveMimeParser
- application/x-activemime
ChmParser
- application/vnd.ms-htmlhelp
- application/x-chm
- application/chm
OneNoteParser
- application/onenote; format=one
OOXMLParser
- application/vnd.ms-powerpoint.template.macroenabled.12
- application/vnd.ms-excel.addin.macroenabled.12
- application/vnd.openxmlformats-officedocument.wordprocessingml.template
- application/vnd.ms-excel.sheet.binary.macroenabled.12
- application/vnd.openxmlformats-officedocument.wordprocessingml.document
- application/vnd.ms-powerpoint.slide.macroenabled.12
- application/vnd.ms-visio.drawing
- application/vnd.ms-powerpoint.slideshow.macroenabled.12
- application/vnd.ms-powerpoint.presentation.macroenabled.12
- application/vnd.openxmlformats-officedocument.presentationml.slide
- application/vnd.ms-excel.sheet.macroenabled.12
- application/vnd.ms-word.template.macroenabled.12
- application/vnd.ms-word.document.macroenabled.12
- application/vnd.ms-powerpoint.addin.macroenabled.12
- application/vnd.openxmlformats-officedocument.spreadsheetml.template
- application/vnd.ms-xpsdocument
- application/vnd.ms-visio.drawing.macroenabled.12
- application/vnd.ms-visio.template.macroenabled.12
- model/vnd.dwfx+xps
- application/vnd.openxmlformats-officedocument.presentationml.template
- application/vnd.openxmlformats-officedocument.presentationml.presentation
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
- application/vnd.ms-visio.stencil
- application/vnd.ms-visio.template
- application/vnd.openxmlformats-officedocument.presentationml.slideshow
- application/vnd.ms-visio.stencil.macroenabled.12
- application/vnd.ms-excel.template.macroenabled.12
Word2006MLParser
pst.OutlookPSTParser
rtf.RTFParser
- application/rtf
xml.SpreadsheetMLParser
- application/vnd.ms-spreadsheetml
xml.WordMLParser
- application/vnd.ms-wordml
MIFParser
- application/x-mif
- application/vnd.mif
- application/x-maker
Mp3Parser
- audio/mpeg
MP4Parser
- video/x-m4v
- application/mp4
- video/3gpp
- video/3gpp2
- video/quicktime
- audio/mp4
- video/mp4
TesseractOCRParser
- image/ocr-x-portable-pixmap
- image/ocr-jpx
- image/x-portable-pixmap
- image/ocr-jpeg
- image/ocr-jp2
- image/jpx
- image/ocr-png
- image/ocr-tiff
- image/ocr-gif
- image/ocr-bmp
- image/jp2
FlatOpenDocumentParser
- application/vnd.oasis.opendocument.tika.flat.document
- application/vnd.oasis.opendocument.flat.presentation
- application/vnd.oasis.opendocument.flat.spreadsheet
- application/vnd.oasis.opendocument.flat.text
OpenDocumentParser
- application/x-vnd.oasis.opendocument.presentation
- application/vnd.oasis.opendocument.chart
- application/x-vnd.oasis.opendocument.text-web
- application/x-vnd.oasis.opendocument.image
- application/vnd.oasis.opendocument.graphics-template
- application/vnd.oasis.opendocument.text-web
- application/x-vnd.oasis.opendocument.spreadsheet-template
- application/vnd.oasis.opendocument.spreadsheet-template
- application/vnd.sun.xml.writer
- application/x-vnd.oasis.opendocument.graphics-template
- application/vnd.oasis.opendocument.graphics
- application/vnd.oasis.opendocument.spreadsheet
- application/x-vnd.oasis.opendocument.chart
- application/x-vnd.oasis.opendocument.spreadsheet
- application/vnd.oasis.opendocument.image
- application/x-vnd.oasis.opendocument.text
- application/x-vnd.oasis.opendocument.text-template
- application/vnd.oasis.opendocument.formula-template
- application/x-vnd.oasis.opendocument.formula
- application/vnd.oasis.opendocument.image-template
- application/x-vnd.oasis.opendocument.image-template
- application/x-vnd.oasis.opendocument.presentation-template
- application/vnd.oasis.opendocument.presentation-template
- application/vnd.oasis.opendocument.text
- application/vnd.oasis.opendocument.text-template
- application/vnd.oasis.opendocument.chart-template
- application/x-vnd.oasis.opendocument.chart-template
- application/x-vnd.oasis.opendocument.formula-template
- application/x-vnd.oasis.opendocument.text-master
- application/vnd.oasis.opendocument.presentation
- application/x-vnd.oasis.opendocument.graphics
- application/vnd.oasis.opendocument.formula
- application/vnd.oasis.opendocument.text-master
PDFParser
CompressorParser
- application/zlib
- application/x-gzip
- application/x-bzip2
- application/x-compress
- application/x-java-pack200
- application/x-lzma
- application/deflate64
- application/x-lz4
- application/x-snappy
- application/x-brotli
- application/gzip
- application/x-bzip
- application/x-xz
PackageParser
- application/x-tar
- application/java-archive
- application/x-arj
- application/x-archive
- application/zip
- application/x-cpio
- application/x-tika-unix-dump
- application/x-7z-compressed
RarParser
- application/x-rar-compressed
PRTParser
- application/x-prt
SAS7BDATParser
- application/x-sas-data
TMXParser
- application/x-tmx
FLVParser
- video/x-flv
WACZParser
- application/x-wacz
WARCParser
- application/warc
- application/warc+gz
QuattroProParser
- application/x-quattro-pro; version=9
WordPerfectParser
- application/vnd.wordperfect; version=5.1
- application/vnd.wordperfect; version=5.0
- application/vnd.wordperfect; version=6.x
XLIFF12Parser
- application/x-xliff+xml
XLZParser
- application/x-xliff+zip
DcXMLParser
- application/xml
- image/svg+xml
FictionBookParser
- application/x-fictionbook+xml
FlacParser
- audio/x-oggflac
- audio/x-flac
OggParser
- audio/ogg
- application/kate
- application/ogg
- video/daala
- video/x-ogguvs
- video/x-ogm
- audio/x-oggpcm
- video/ogg
- video/x-dirac
- video/x-oggrgb
- video/x-oggyuv
OpusParser
- audio/opus
- audio/ogg; codecs=opus
SpeexParser
- audio/ogg; codecs=speex
- audio/speex
TheoraParser
- video/theora
VorbisParser
- audio/vorbis
Kontakt
Wir setzen auf ganzheitlichen Service & auf eine High End Enterprise Search Engine. Kontaktieren Sie uns.