Plus de 14 millions de pages de livres numérisés apparaissent en ligne Automatique traduire
Des millions de pages numérisées de livres sont apparues sur la ressource Flickr, que l’organisation américaine Internet Archive a publiée pour une utilisation gratuite. À l’heure actuelle, environ 3 millions d’images ont déjà été publiées et ce n’est que le début, les organisateurs du projet indiquent que plus de 14 millions de pages de texte numérisé seront utilisées gratuitement.
La mise en œuvre d’un projet d’une telle envergure n’a été rendue possible que grâce à l’algorithme récemment créé, qui extrait automatiquement les images de plus de 2 millions de livres, qui sont actuellement stockés dans la bibliothèque publique de l’organisation Internet Archive. Ce programme, développé par Kalev Litaru, chercheur à l’Université de Georgetown, est configuré pour reconnaître automatiquement le texte et extraire 500 mots de chaque image numérisée, ce qui permet une recherche de texte dans la collection.
Il est à noter que toutes les images de textes postés pour le compte d’Internet Archive ne seront pas protégées par le droit d’auteur, ce qui permettra leur distribution gratuite sur Internet. Les créateurs du projet estiment qu’avec le temps, ils seront en mesure de créer une bibliothèque visuelle dans laquelle les informations seront recherchées en lisant des images.
À ce jour, l’organisation Internet Archive Book Images est incluse dans le projet général The Commons, dont le but est de créer des bibliothèques ouvertes pour préserver le patrimoine d’Internet. Le service comporte déjà des sous-catégories spéciales pour le matériel audio, vidéo et graphique, les versions obsolètes des sites, les jeux pour consoles des années 1970 et 80, ainsi que pour toutes sortes de logiciels. Les informations stockées dans Internet Archive contiennent déjà 19 Pb et comprennent plus de 600 millions de textes numérisés de livres de genres et directions variés écrits au cours des 500 dernières années.
Svetlana Korableva © Gallerix.ru
- «Utilitarianism» by John Stuart Mill
- "The Origins of Totalitarianism" by Hannah Arendt, summary
- Actual experience of opposing totalitarianism
- Totalitäre Tendenzen in der Architektur der 20-30er Jahre
- Banksy: ¿Vandalismo o arte?
- In Moscow, the opening of the library-cultural center of the writer Fazil Iskander
- 中式家具是企业声望和财富的象征
- Farewell to the sage. Fazil Iskander passed away
Vous ne pouvez pas commenter Pourquoi?