JanKrause.net - InfoDocBlog

InfoDocBlog @ jankrause.net

PowerPoint

2010-11-15 09:22:19

 

"PowerPoint is symptomatic of a certain type of bureaucratic environment: one typified by interminable presentations with lots of fussy bullet-points and flashy dissolves and soundtracks masked into the background, to try to convince the audience that the goon behind the computer has something significant to say. It’s the tool of choice for pointy-headed idiots with expensive suit and skinny laptops who desperately want to look as if they’re in command of the job, with all the facts at their fiddling fingertips, even if Rome is burning in the background. Nothing stands for content-free corporate bullshit quite like PowerPoint. And that’s just scratching the surface…"

The Jennifer Morgue, Charles Stross, 2006. ISBN: 978-0-441-01814-7

Biographie: Richard Stallman et la révolution du logiciel libre

2010-10-31 14:09:56

 

RMS
"Chaque génération a son philosophe, écrivain ou artiste qui saisit et incarne l'imaginaire du moment. Il arrive que ces philosophes soient reconnus de leur vivant, mais le plus souvent il faut attendre que la patine du temps fasse son effet. Que cette reconnaissance soit immédiate ou différée, une époque est marquée par ces hommes qui expriment leurs idéaux, dans les murmures d'un poème ou dans le grondement d'un mouvement politique. Notre génération a un philosophe. Ce n'est ni un artiste ni un écrivain. C'est un informaticien."
Lawrence Lessig, fondateur et précédent de l'Organisation Creative Commons, professeur à l'université de Stanford.
Pour en savoir plus sur le père du logiciel libre (licence GPL), lauréat du prix MacArthur, créateur de la Free Software Foundation, et du GNU.
Libre accès sur le Web:

Combien de temps faut-il pour faire un Homme?

2010-09-22 15:35:00

 

"Combien de temps faut il pour faire un Homme? Quelques minutes d'égarement estimeront certains. L'obstétricien lui dira neuf mois le temps d une grossesse. Pour l'ethnologue, ce sera deux mille ans... le temps de la culture. Le paléontologue lui se situera sur une échelle de plusieurs centaines de millions d'années... Et tous auront raison!" Denis Duboule. 2010-10-21. UNIGE.

Encapsulez des livres de Gallica sur votre site

2010-08-04 15:48:22

 

Il suffit de copier/coller le code apparaissant au bas du document dans Gallica..

Croissance du web sémantique

2010-07-28 13:53:47

 

L'idée du web sémantique remonte au milieu des années 1990... et celui-ci à eu du mal a démarrer. Maintenant ça croissance est rapide et soutenue par de nombreux contributeurs (Wikipedia, le gouvernement britannique, Facebook, Google, etc.). Entre autres, deux technologies ont permis de stimuler la développement du web sémantique :

  • CoolURI : utilise une propriété tout à fait standard du protocole HTTP (303 forwarding) : si une machine visite une page on la redirige sur du RDF (voir billet précédent) ... si une personne (un navigateur, en fait) visite une ressource RDF, on la redirige sur la page web correspondante.
  • RDFa : permet de cacher du RDF dans des pages web standard (il n'apparait pas dans les navigateurs mais les autres machines peuvent l'exploiter)

Introduction au web sémantique pour les nuls

2010-07-28 13:20:47

 

Le web sémantique c'est un web compréhensible par les machines. Il permet en particulier d'effectuer des recherches plus efficaces telles que par exemple : Quels sont les trois magasins de vélos les plus proches d'ici et ouverts en ce moment ? Pour répondre à cette question, il est nécessaire que les machines qui indexent les sites web soit en mesure de manipuler les concepts suivants:

  • que telle information est une adresse,
  • que telle autre information est un horaire d'ouverture,
  • et finalement qu'il s'agit bien du site web d'un magasin et que celui-ci s'occupe de vélo même si les mots utilisés sur la page sont cycle ou bicyclette
En fait, le web sémantique est un ensemble de normes définies par le Word Wide Web Consortium:
  • Ressource Description Framework (RDF) : le langage de base du web sémantique, permettant l'expression générale de modèles de données sous forme de triplets: {sujet, prédicat, objet}. Il existe plusieurs manières (sérialisations) de noter le RDF : RDF/XML, Notation3 (N3), Turtle, ...
  • RDF Schema (RDFS) : Permet d'exprimer des taxonomies, c'est à dire des propriétés et classes de ressources RDF.
  • Web Ontology Language (OWL) : enrichit la description des propriétés et classes et en permettant notamment de définir des relations entre les classes (égalité, inclusion, cardinalité, etc.)
  • SPARQL Protocol and RDF Query Language (SPARQL) est le langage d'interrogation du web sémantique qui permet d'adresser des requêtes aux moteurs d'inférence sémantique (ex: DBpedia) et d'obtenir des réponses sémantiques.

Twitter : 3 outils utiles

2010-07-23 10:39:09

 

  • Topsy : un moteur de recherche spécialisé
  • TweetTabls : suivez plusieurs recherches Twitter en parallèle et mises-à-jour en temps réel
  • TweetMeme : les sujets les plus actifs sur Twitter (basé sur les liens ou URI les plus tweetés)
A noter qu'il existe plusieurs autres outils similaires dans ces trois catégories...

INSPIRE bêta : une bibliothèque numérique intéressante

2010-07-20 11:05:28

 

Le projet de bibliothèque numérique INSPIRE est en bêta. Voici quelques points intéressants:

  • la bonne réactivité du système sur environ un million de documents
  • la diversité de langages de recherche supportés (Google like, booléen avec parenthèses, expressions régulaires, syntaxe SPIRES, notices similaires)
  • la variété des types de documents pris en charge par le logiciel Invenio : images, vidéo, livre, articles scientifiques (multi-versions et multi-lingue), presse, code informatique, etc.
  • l'exhaustivité du projet : l'intégralité de l'information en physique des particules
  • l'extensibilité de l'outil : pour éviter les ralentissement le système est interopérable avec le grid EGEE via D4Science/gCube et GEANT le réseau haut débit européen
  • les indicateurs bibliométriques proposés

GNU/Linux dominera le marché mobile

2010-07-16 10:53:51

 

En 2015, 1/3 des smartphones et 2/3 des tablettes graphiques fonctionneront sous GNU/Linux
Actuellement les systèmes d'exploitations mobiles les plus populaires sont:

  • Google: Android
  • Palm: WebOS
  • Nokia et Intel: Meego
Apple iPhone OS et RIM BlackBerry OS sont des exceptions notables à cette tendance. Cependant, nombre de producteurs de matériel électronique se sont lancé dans dans des produits basés sur GNU/Linux, par exemple Samsung, Panasonic, NEC, Texas Instruments.

L'ACTA inquiète beaucoup. Les bibliothécaires compris.

2010-07-13 09:41:55

 

Les négociations du traité sur la contrefaçon (ACTA) inquiètent beaucoup car elles menacent:

Les professionnels de l'information se sentent concernés. Tant pour des raisons de principes (liberté d'expression, censure, etc.) que pratiques (p.ex. la généralisation de l'utilisation de Digital Rights Management / DRM est nuisible à leurs activités). Ainsi, l'association de bibliothécaires ADBS à fait part de ses inquiétudes aux eurodéputés le 8 juillet.

Google démocratise la création d'applications sous Android

2010-07-13 08:43:24

 

Avec AppInvetor, plus besoin de connaissances en programmation pour créer vos applications personnalisées sur votre smartphone. Google, se démarque ainsi d'Apple qui soumet toute application destinée à iOS (iPhone, iPad) à une procédure de validation et à des licences restrictives (les logiciels open source sous licence GPL y sont refusés).

MeeGo Linux : un excellent système pour smartphones et tablettes graphiques

2010-07-11 09:33:57

 

Comparaison de quelques éléments entre MeeGo, Android et iOS (Apple):

  • La navigation web est plus rapide que sous Android ... lui-même plus rapide que iOS. MeeGo est actuellement l'unique plateforme à proposer Firefox Mobile, et Google Chrome est aussi disponible.
  • Comme Android, MeeGo est construit sur la base stable de Linux. Ce n'est pas le cas de iOS!
  • Comme Android, MeeGo est Open Source, et ne limite pas ses usagers à un unique dépôt d'applications contrôlé. C'est ce que fait Apple le fait avec l'AppStore. En effet, La licence de l'AppStore exclut le logiciel libre, et donc des milliers de logiciels gratuits, stables, éprouvés et évolutifs.
  • Comme Android, MeeGo peut être installé sur divers smartphones et tablettes graphiques alors qu'il y a peu de choix pour iOS ... par exemple l'aava, qui n'a rien à envier à l'iPhone et est doté d'un connecteur USB-mini. Et sur le Nokia N900, il y a une une sortie TV :-)

YouTube mobile passe à HTML5

2010-07-08 06:13:54

 

L'interface web pour smartphones de YouTube passe à HTML5 ( m.youtube.com ).
Concrètement, cela implique que les vidéos sont lues directement par le navigateur. Adobe Flash n'est plus nécessaire. Quelques avantages:

  • meilleure qualité
  • moins de bande passante
  • meilleur autonomie (consomme moins d'électricité)
  • plus stable (moins de bugs que Flash)

Pour que le web reste ouvert : Drumbeat

2010-07-06 11:39:47

 

Mozilla Drumbeat a pour but que le web reste ouvert. Pratiquement, Drumbeat supporte et organise des projets et évènements qui vont dans ce sens, par exemple:

  • Seeks: infrastructure de recherche sociale du web
  • Great Green Open Web: un projet permettant de montrer la consommation énergétique pour chaque site web, de manière à pouvoir optimiser le web au niveau énergétique.
  • P2PU's School of Webcraft: des cours libres sur la programmation web. Par exemple sur le HTML5.
  • Tatoeba: traduction multilingue et collaborative de phrases.
  • etc.

MODS / MADS : quelle évolution ?

2010-07-05 11:57:43

 

MODS et MADS sont des standards de métadonnées bibliographiques définis par la Library of Congress (US). Leur intérêt? MODS est à la fois plus riche que le Dubblin Core et plus simple que le MARC. MADS sert à décrire les vedettes d'autorité.
Ces formats continuent de s'améliorer et il semble qu'il y aie une volonté de les harmoniser avec les nouveaux standards, notamment:

  • le RDA, qui fait suite au AACR2
  • et possiblement le RDF, qui constitue la base du web sémantique
Plus d'infos:

De la part des publications scientifiques en open access

2010-07-05 10:28:23

 

Une étude publiée le mois passé estime la part totale de l'open access à 20.4% (toutes disciplines confondues). A noter que:

  • Ces 20.4% ce déclinent en 11.9% de green open access (dépôts institutionnels, etc.) et 8.5% de golden open access (sur le site des éditeurs).
  • Il y a des variations entre les disciplines: la chimie à le taux le plus faible (13%), les sciences de la terre le plus élevé (33%).
  • De plus, en médecine, biochimie et chimie, la fraction de golden open access est plus élevée que dans les autre disciplines.

Specto : un logiciel libre utile pour la veille documentaire

2010-07-04 09:10:19

 

Specto est un petit logiciel libre de notification. Il permet d'effectuer de la veille sur des sources diverses d'informations et d'en ajuster la fréquence de mise-à-jour pour chaque source. Par défaut, les notifications sont affichées à l'écran. Voici plusieurs types de ressources supportées:

  • Flux RSS/Atom
  • Pages Web. Un plus: il est possible de définir une marge de tolérance. Par ailleurs, les pages protégées par mot de passe sont supportées.
  • Comptes e-mail (IMAP et POP, y compris GMail), ce qui est particulièrement utile si l'on utilise un compté e-mail dédié aux alertes.
  • Son compte Facebook.
  • Un fichier ou un répertoire ... à noter qu'il peut s'agir d'une ressource partagé en réseau
  • Un projet géré par le logiciel de de gestion de version décentralisée Bazaar.
  • etc.
Les utilisateurs avancés peuvent délclencer l'exécutuion d'une commande lors de la mise à jour d'une source (par exemple pour traiter l'information). Specto est pacagé pour Ubuntu et peut être installé en un clic via votre gestionnaire de paques préféré. Il entre autre aussi disponible sous Debian et Fedora.

Alternative à Facebook : Diaspora se développe

2010-07-03 08:51:37

 

Diaspora est un réseau social libre, sécurisé et décentralisé en pleine construction. Ce logiciel laisse à l'utilisateur le contrôle de sa vie privée comme les données ne sont pas centralisées sur un serveur central mais peuvent être stockées sur sa propre machine ou un serveur de confiance.
Bien que très jeune, le projet avance: voici une vidéo qui montre un prototype fonctionnel avec 6 utilisateurs connectés sur 6 noeuds (serveurs) différents.
A noter que l'interface est un prototype et que les développeurs du projet ont annoncé qu'ils vont y travailler prochainement.
Pour plus d'infos une autre vidéo plus longue, lire l'article de Numerana:

QR codes : offrez des instructions et de l'aide in situ aux usagers de votre bibliothèque

2010-07-01 11:10:36

 

Les QR codes sont des codes barres à deux dimensions. Ils peuvent être lus et utilisés par les smartphones (via leur caméras).
Une application courante consiste à y stocker une URL, que le smartphone ouvre automatiquement dans son navigateur à la lecture du QR code. Les usages en bibliothèque sont infinis. Mettez par exemple des liens vers vos ebooks et compléments électroniques dans les rayons au niveau des exemplaires papier correspondants. Lorsque les imprimés sont tous sortis, l'usager peut facilement se rabattre sur l'électronique. Côté assistance technique, cela permet de lier une vidéo de démonstration de la borne de prêt automatique ou du nouveau copieur multifonction directement là où elle est le plus utile.
Dans le futur, on peut imaginer que ce type de fonctionnalité passe par des puces RFID dont la lecture est quand même plus pratique... ou le serait si les smartphones étaient équipés de lecteurs appropriés.
Pour plus d'information, voir l'article du Journal of Information Literacy, Vol 4, No 1 (2010) lié ci-dessous.

Bibliométrie : éléments d'évaluation des auteurs

2010-06-30 10:24:03

 

  • facteur d'impact: comme il s'agit d'une mesure calculée sur deux ans et concernant une revue dans son ensemble, on peut résumer son intérêt pour évaluer un auteur en un mot: ridicule
  • h-index: "Un scientifique a un indice h si h de [ses] Np articles ont chacun au moins h citations, et les autres (Np - h) articles ont au plus h citations chacun." Wikipedia C'est mieux, mais un auteur qui publie 5 articles recevant chacun 5 citations aura le même index qu'un auteur ayant publié 5 articles ayant été cités chacun 1000 fois...
  • g-index: "Given a set of articles ranked in decreasing order of the number of citations that they received, the g-index is the (unique) largest number such that the top g articles received (together) at least g2 citations." Wikipédia. Similaire mais mieux: on tient compte du total des citations reçus par les articles les plus populaires d'un auteur.
  • w-index: dans le même style que le g-index mais basé sur un facteur multiplicatif plutôt que sur une puissance: "if w of a resarcher's papers have at least 10w citations each and the other papers have fewer than 10(w+1) citations, that reasearcher's index is w" JASSIST 61(3):609-614, 2010

MarcXimiL

2010-06-29 21:29:32

 

MarcXimiL est un logiciel d'analyse de similarité bibliographique. Il permet notamment de détecter des doublons et quasi doublons et d'effectuer des calculs bibliométriques.
Démonstration de l'utilisation basique (environ 2 minutes)-

Apple pas si net

2010-06-29 09:54:36

 

C'est clair que les produits Apple sont beaux et marchent bien.
Par contre, la licence de l'AppStore est plutôt inquiétante: Apple veut tout y contrôler au point d'en bannir les logiciels libres.
Dans la même veine, cela n'aide au bon développement du web et en particulier au passage à HTML5 que leur navigateur Safari ne supporte ni Theora ni WebM.
Heureusement, avec Meego, il va prochainement y avoir d'excellentes alternatives à l'iPhone et l'iPad.

DublinCore embarqué

2010-06-29 09:28:44

 

Pour permettre un traitement plus homogène et donc efficace des documents (classification, catégorisation, documents similaires, déboulonnage), il est utile d'inclure systématiquement un maximum de métadonnées au format Dublin Core dans les documents qui le permettent (ex: PDF, EPUB, HTML OASIS[format notamment utilisé par OpenOffice] )...
En effet, ce format est ouvert, simple à traiter et déjà très répandu.

ACTA / HADOPI : méchantes difficultés techniques d'application en vue

2010-06-28 20:37:52

 

Le souci avec HADOPI c'est qu'uniquement le peer to peer est visé, alors que la majorité échanges illégaux passent par d'autres biais (direct par clé usb, cd, dvd, streaming, etc.). Mais en plus des technologies de peer to peer encrypté permettent aussi d'y échapper... et le plus drôle c'est qu'il existe déjà des programmes gratuits, très simples à utiliser et multi-plateforme (linux, mac, windows) par exemple OneSwarm développé par l'Université de Wahsington.
Une fois téléchargé, il est possible de cacher les documents piratés par double encryption (notamment avec TrueCrypt de nouveau multi-plateforme et gratuit). Le principe est que l'on peut cacher deux jeux de données dans un fichier ou un disque et que si on entre un premier mot de passe le premier jeu apparaît et de même avec le second mot de passe. Les données cachés sont mathématiquement indétectables et ce qui rend toute inspection inutile.
En résumé, il reste à se demander l'intérêt d'une loi inapplicable.

Public Peer Review / Open Peer Review

2010-06-28 16:18:43

 

L'Open Peer Review va plus loin que l'Open Access classique: le mécanisme de revue des articles est publique. D'une part, cela permet d'éviter des magouilles de la part des comités de relecture (choisis par les éditeurs) et en plus, il semble que ce soit plus réactif.
Ulrich Pöchl (Max Plank Institute) a commencé à appliquer cette méthode il y a bientôt 10 ans pour la revue Atmospheric Chemistry and Physics (qui est la revue phare de ce domaine, avec le facteur d'impact le plus élevé). Et maintenant le principe s'étend chez l'éditeur Copernicus.

ACTA menace la Net Neutrality, et concrêtement ça veut dire quoi?

2010-06-28 11:45:41

 

Voici un extrait de Wikipédia FR (2010.06.28) sur la neutralité du réseau:
"La neutralité du Net exclut toute discrimination à l'égard de la source, de la destination ou du contenu de l'information transmise sur le réseau. Ainsi, ce principe garantit que les utilisateurs ne feront face à aucune gestion du trafic internet qui aurait pour effet de limiter leur accès aux applications et services distribués sur le réseau [...]
La neutralité du Net assure que les flux d'information ne sont ni bloqués, ni dégradés par les opérateurs de télécommunications, permettant ainsi aux utilisateurs d'utiliser librement l'architecture communicationnelle."
En résumé, le perte de la neutralité du réseau peut notamment conduire à discrimination envers: des sources d'information, des consommateurs d'information (vous par exemple), des types d'information, et des modes de communication (protocoles, tels que par exemple le peer-to-peer).

Le casino de l'ACTA doit fermer

2010-06-28 11:18:21

 

Un nouveau round de négociations du traité sur la contrefaçon (ACTA) commence aujourd'hui, le 28. juin 2010 en Suisse.
(1) atteinte à la liberté d'expression sur le Net et la protection de la vie privée (ce qui concerne tous le monde au fonds)
(2) frein à l'accès aux médicaments: en s'attaquant à la production et à l'exportation de médicaments génériques
Plus d'infos (Quadrature du Net)

Twitter et le Web sémantique en temps réel

2010-06-27 21:41:11

 

Twitter pourrait enrichir le web sémantique avec des données en temps réel. Comment?
Les annotations contiennent des métadonnées structurées (géographiques, films, musique, etc.) deviennent de plus en plus courantes, Ces annotations peuvent directement être liées via le format RDF à des services tels que DBpedia ou GoogleMaps.
Ainsi, ces données peuvent être exploitées par le biais de requêtes SPARQL [plus d'infos].

Faire un screencast sous Ubuntu

2010-06-27 10:46:54

 

Côté logiciel, il y a de nombreuses possibilités. Trois outils ont été retenus ici pour leur simplicité et leur efficacité: XvidCap (capture vidéo et audio), Enregistreur de sons (intégé dans Ubuntu: ré-acquisition éventuelle de son), OpenShot (édition vidéo et audio, puis exportation).
Tous ces logiciels sont packagés dans Ubuntu 10.4 et peuvent êtres installés via votre gestionnaire de paquets préféré (ex: synaptic).
OpenShot peut exporter directement en format web (YouTube, Vimeo, etc.). Les formats protpriétaires, nécessitent d'installer des codecs multimédia, ce qui peur être fait via medibuntu.org.