De:Features
Aus YaCyWiki
Features
Kurz und bündig die wichtigsten technischen Fakten:
- P2P Netzarchitektur
- crossplattform für (fast) jedes Betriebssystem
- analysiert
- TXT unformatierter Text
- CSV tabellendaten
- RTF formatierter Text
- XML strukturierte Daten
- HTML
- RSS, RDF, Atom Newsfeeds
- MS Office Excel, Word, Powerpoint
- MS Visio Diagramm
- ODF OpenDocument
- PS Postscript
- SWF Adobe Flash
- VCard
- Archiv : 7zip, zip, bz2, tbz, tbz2, tar.gz, rpm, jar, apk
- Bilder : png, jpg, gif, svg, ico, bmp, tif, psd
- CAD Drawings : dwg
- MM FreeMind
- Audio : mp3, ogg, oga, m4a, m4p, flac, wma, sid
- Torrent torrent metadata
- OpenSearch Interface
- Loadbalancing
- automatische redundante Indexverteilung
- direkter Fremd-DB Import (Surrogate Harvester API)
- Filterproxy für automatische Indexierung
- integrierter Webserver mit CGI Unterstützung
- interne .yacy Domains
- Bootstrapping per zentraler Seedlisten
- Rechtschreibprüfung
- Filterausdrücke z.B. filetype:pdf
- UTF-8 Unterstützung
genutzte Technologien
Nachfolgend alle im Projekt eingesetzten Technologien:
- Java 1.7
- XHTML, CSS, JavaScript
- JSON
- Dublin Core
- Externen komponenten :
- Apache Commons Toolkit
- Apache HttpComponents
- Apache Jakarta Oro RegExp
- Apache POI API for Microsoft Documents
- Apache James Mime4j
- Apache Lucene
- Apache Solr
- Apache PDFBox and FontBox
- Apache Xerces XML Parser
- Apache XML APIs
- Bouncy Castle Crypto APIs : Provider, Mail
- GlassFish Servlets
- Guava
- ICU International Components for Unicode
- J7Zip
- Java CIFS Client Library
- Jazzy Spelling API
- Jaudiotagger
- JSch Java Secure Channel
- JDBC
- Jetty Web server
- jQuery JavaScript library
- JSONIC json encoder/decoder
- json-simple toolkit
- jsoup Java HTML Parser
- language-detection library
- metadata-extractor API
- Mozilla charset detector
- Noggit JSON parser
- Restlet Framework
- SLF4J Simple Logging Facade for Java
- Spatial4j spatial/geospatial library
- Stax2 API
- TwelveMonkeys ImageIO plugins : BMP, TIFF
- Giant Java Tree TAR Package
- WebCat SWF Package
- Weupnp tiny UPnP client
- Woodstox XML processor
- XMP Adobe's Extensible Metadata Platform
- Build und tests utils
- Apache Ant Building Environment
- JRPM
- JUnit testing framework
Konkrete Zuordnung siehe Aufbau des Peers
Probleme
- Instabilität
- keine Unterstützung nicht klar in Wörter trennbare Sprachen
- sehr einfaches Stemming