Ceci est une ancienne révision du document !

Web et échange de données

Avènement du web

les entreprises ont dut fournir à leur client et partenaire de plus en plus de services « à la demande » depuis les années 2000.

Du fait de l’augmentation des capacité réseau et infrastructure.
Du fait de la prolifération des « providers Internet » qui ont aussi contribué à la démocratisation des technologies dites « web ».

HTTP

Définition

Ainsi le protocole HTTP s’est imposé comme fondement « réseau » de la plupart des échanges entre application.

L'HyperText Transfer Protocol, plus connu sous l'abréviation HTTP — littéralement « protocole de transfert hypertexte » — est un protocole de communication client-serveur développé pour le World Wide Web.

HTTPS (avec S pour secured, soit « sécurisé ») est la variante du HTTP sécurisée par l'usage des protocoles SSL ou TLS.

HTTP est un protocole de la couche application. Il peut fonctionner sur n'importe quelle connexion fiable, dans les faits on utilise le protocole TCP comme couche de transport.

La version actuelle de http est la version 1.1. Elle a été publié par IETF en Février 2014 dans les RFC 7230 à 7237.

HTTP est un protocole client-serveur à commande : c’est-à-dire qu’il demande à un serveur de faire quelques choses et de renvoyer quelques choses à l’appelant.

La commande est encapsulée dans une requête les éventuels retour dans une réponse.

Le protocole HTTP/2 diffère de HTTP/1.1 sur plusieurs aspects:

Il est encodé en binaire plutôt qu'en texte. Il ne peut donc plus être lu ou écrit à la main. Malgré cette difficulté, il est désormais possible d'implémenter des techniques d'optimisation avancée.
C'est un protocole multiplexé. Plusieurs requêtes en parallèle peuvent être gérées au sein de la même connexion, supprimant ainsi la limitation séquentielle de HTTP/1.x.

HTTP/2 compresse les en-têtes, étant donné que des en-têtes similaires sont échangés lors d'une suite de requêtes, on supprime ainsi la duplication et l'échange inutiles des données similaires.

Il permet au serveur de remplir le cache du client avant qu'il ne soit demandé par ce dernier, on parle alors d'évènements générés par le serveur.

Fonctionnement

La requête est composée d’une zone d’entête et d’un corps.

Les entêtes sont codifiées mais extensibles

Le corps référence une URI et une méthode à exécuter.

La réponse est composée d’une zone d’entête et d’un corps.

Les entêtes sont codifiées mais extensibles

Le corps comporte ou pas du contenu et peut être facultatif selon la méthode utilisée.

Méthodes

GET est la méthode la plus courante pour demander une ressource. Une requête GET est sans effet sur la ressource, il doit être possible de répéter la requête sans effet.

HEAD ne fait que demander des informations sur la ressource, sans demander la ressource elle-même.

POST transmet des données en vue d'un traitement à une ressource. L'URI fourni est l'URI d'une ressource à laquelle s'appliqueront les données envoyées.

OPTIONS obtient les options de communication d'une ressource ou du serveur en général.

CONNECT pour utiliser un proxy comme un tunnel de communication.

TRACE demande au serveur de retourner ce qu'il a reçu, dans le but de tester et effectuer un diagnostic sur la connexion.

PUT remplace ou ajoute une ressource sur le serveur. L'URI fourni est celui de la ressource en question.

PATCH fait une modifie partiellement une ressource, contrairement à PUT.

DELETE supprime une ressource du serveur.

Données

Problématique

Informations et documents dans l’entreprise

Constat :

Inflation du volume d’informations
Coût et difficulté :
Difficultés à retrouver un document
Coût induit par la gestion de documents

Pour structurer cette « masse » d’information, il faut la transformer en donnée.

Une donnée est une information structurée.

Cela peut se faire soit en travaillant directement sur les informations ou en en ajoutant d’autres afin de pouvoir plus facilement retrouver ce que l’on recherche.

W3C

Le WORLD WIDE WEB Consortium crée des standards pour le Web.

Le W3C en 7 points…

Accès universel (internationalisation, web mobile…)
Web sémantique (RDF, XML…)
Confiance (signatures électroniques, collaboratif…)
Intéropérabilité (consensus industriel)
Evolutivité (simplicité, modularité, compatibilité…)
Décentralisation (systèmes répartis, tolérance aux erreurs)
Multimédia (SVG, SMIL, HTML5)

Pour plus d’informations : www.w3c.org

Principales normalisations

	1986 : SGML	1991 : HTML	1998 : XML
Objectifs	adaptabilité	simple	puissance de SGML
	intelligence	portable	Simplicité de SGML
	gestion des liens	gestion de liens	Simplicité de SGML
Inconvénients	complexee	non adaptable
Inconvénients	difficilement portable	non intelligent

XML

Définition

eXtensible Markup Language

Recommandation (norme) du W3C
Spécifiant un langage
Constitué d’un ensemble d’éléments appelés balises
Utilisable pour créer d’autres langages

2 concepts fondamentaux

Structure, contenu et présentation sont séparés
Les balises ne sont pas figées

Conséquences :

XML est un format de document
XML est un format de données
XML est un mode de structuration de l’information
XML est un méta-langage

Caractéristiques

Richesse sémantique de SGML

Compatible SGML
Dédié au traitement des données
Soutient une grande variété d’applications
Assure un entretien aisé
Intelligent

Facilité de mise en œuvre de HTML

Simple et lisible
Portable et facilement utilisable sur Internet
Assure un développement aisé

Exemple

<song>
<title> Ma chanson </ title >
<composer> par l’auteur</ composer >
< producer > Dupond</producer>
<editor> Maison edition</ editor >
<duration > 6:20</duration>
<date> 1978</ date >
< artist >  Toto</artist>
</song>

Balises “propriétaires” compréhensibles à la profession, dérivation des langages proprétaires.
XML sépare le contenu de son aspect ( à la différence de HTML ou tout peut être mélangé)

Structure

entete

<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="presentation1.xsl"?>
<exposition>

Contenu

<tableau>
		<titre>Déjeuner sur l'herbe</titre>
		<artiste>Edouard Manet</artiste>
	</tableau>
	<tableau>
		<titre>Déjeuner des Canotiers</titre>
		<artiste>Auguste Renoir</artiste>
	</tableau>
	<tableau>
		<titre>Waterloo Bridge, le soleil dans le brouillard</titre>
		<artiste>Claude Monet</artiste>
	</tableau>
	<tableau>
		<titre>Mardi Gras, soleil couchant, bd Montmartre</titre>
		<artiste>Camille Pissaro</artiste>
	</tableau>
	<tableau>
		<titre>Les Joueurs de cartes</titre>
		<artiste>Paul Cézanne</artiste>
	</tableau>
</exposition>
 
</xml>

SPECIFICATIONS

Résumé des spécifications :

Un document doit commencer par une déclaration XML
Toutes les balises avec un contenu doivent être fermées
Toutes les balises sans contenu doivent se terminer par les caractères />
Le document doit contenir un et un seul élément racine
Les balises ne doivent pas se chevaucher
Les valeurs d’attributs doivent être entre guillemets
La casse doit être respectée pour toutes les occurrences de noms de balise (MAJUSCULES ou minuscules).

Un document respectant ces critères est dit “bien formé“

Arbre XML

Exemple

Exemple de fichiers XML :

<adresses>
  <!--Carnet d'adresses-->
  <personne id= "personnel">
    <type classe= "famille"/>
    <nom>Durand</nom>
    <prenom>Martine</prenom>
    <adr:adresse>6, rue des Magnolias</adr:adresse>
  </personne>
</adresses>

Arbre

Arbre correspondant :

JSON

JSON (Javascript Object Notation) est un format de donnée textuelle. Il est permet de représenter de l’information structurée et en particuliers des Objets Javascript.

Il est décrit dans la RFC 7159 de l’IETF.

En ce sens c’est un « concurrent » d’XML.

JSON n’utilise que deux types d’éléments structurels :

Des paires nom/valeur
Des listes ordonnées de valeurs

Ces éléments structurels peuvent représenter trois types de données :

Des objets
Des tableaux
Des éléments génériques (tableau, objet, booléen, nombre, string, null)

JSON contrairement à XML ne se veut pas universel et ne peut être étendu.

Toutefois, il est moins verbeux qu’XML et aussi « lisible » que lui.

JSON ne peut être validé et il est donc à la charge du développeur de vérifier si les éléments récupérés sont bien ceux attendus.

Un document JSON représente un Objet Javascript.

Représentation

Le type MIME application/json est utilisé pour transporter un document JSON sur HTTP.

Historiquement, l’opérateur eval était utilisé pour « transformer » une chaine de caractère en Object javascript.

Pour des raisons de sécurité, les navigateurs « modernes » intègrent nativement JSON et fournissent l’objet Natif JSON pour évaluer les documents JSON

var data = JSON.parse(json_data);

Exploitation

La structuration de l’information est importante mais il est aussi nécessaire de pouvoir « comprendre » la structure d’un document.

Pour cela il est nécessaire de définir la grammaire de notre document.

Il existe deux modes de définition de celle-ci :

Les DTD définition « historique »
Les schémas XML basés sur une définition XML

DTD

Définition

DTD = Document Type Definition

La DTD fournit :

la liste des éléments,
la liste des attributs,
des notations et
des entités du document XML associé ainsi que
les règles des relations qui les régissent.

Résumé des spécifications :

Une DTD (grammaire) permet de déclarer :
- un type d’élément,
- une liste d’attributs d’un élément,
- une entité
Chaque balise du langage doit faire l’objet d’une et d’une seule déclaration

Un document XML est dit “valide” s’il possède une DTD et si sa syntaxe est conforme aux règles de la DTD

Un document “valide” est obligatoirement « bien formé »

La DTD est déclarée dans le document XML par la balise !DOCTYPE

Elle peut être :

incluse dans le code source du fichier XML, ou DTD interne :

<!DOCTYPE élément-racine [déclaration des éléments]>

décrite dans un fichier externe, ou DTD externe :

<!DOCTYPE élément-racine SYSTEM "nom_fichier.dtd">

Exemple

DTD interne

<?xml version="1.0" standalone="yes"?>
<!--Comme vous définissez une DTD interne, votre fichier est indépendant (standalone).-->
 
<!DOCTYPE parent [
 
<!--Début de la DTD interne avec parent comme élément de racine.-->
 
<!ELEMENT parent (garcon,fille)>
<!--L’élément racine parent contiendra les sous-éléments garcon et fille.-->
 
<!ELEMENT garcon (#PCDATA)>
<!ELEMENT fille (#PCDATA)>
<!--#PCDATA indique au Parser XML que l'élément garcon contient des données
exprimées en chiffres ou en lettres. Idem pour l'élément fille.-->
 
]>
<!--Fin de la DTD-->
 
<parent> <!--Racine du document XML.-->
<garcon>François</garcon>
<fille>Elisabeth</fille>
</parent>  <!--Fin du document XML.-->

DTD externe

fichier XML

<?xml version="1.0" standalone="no"?>
<!--Comme vous définissez une DTD externe, votre fichier n’est plus indépendant (standalone).-->
 
<!DOCTYPE parent SYSTEM "parent.dtd">
<!--Déclaration de la DTD externe dans le Fichier parent.dtd.-->
 
<parent>
<!--Racine du document XML.-->
 
<garcon>François</garcon>
<fille>Elisabeth</fille>
</parent>
<!--Fin du document XML-->

Fichier parent.dtd

<!ELEMENT parent (garcon,fille)>
<!--L’élément racine parent contiendra les sous-éléments garcon et fille.-->
<!ELEMENT garcon (#PCDATA)>
<!ELEMENT fille (#PCDATA)>
<!--
#PCDATA indique au Parser XML que
l'élément garcon contient des données
exprimées en chiffres ou en lettres.
Idem pour l'élément fille.
-->

La DTD contient :

Une ou plusieurs définitions d’éléments introduites par la balise !ELEMENT :

<!ELEMENT nom-élément valeur>

Une ou plusieurs listes d’attributs introduites par la balise !ATTLIST :

<!ATTLIST nom-élément attribut type défaut>

Une ou plusieurs définitions d’entité introduites par la balise !ENTITY :

<!ENTITY nom-entité "valeur">

ou

<!ENTITY nom-entité SYSTEM "nom_fichier">

Espaces de nom

XML Namespaces est une recommandation permettant d’utiliser le vocabulaire (les balises) de 2 DTD distinctes sans risque d’ambigüité.

Inconvénients des DTD :

Une DTD est difficile à lire
Une DTD est non extensible (ce n’est pas un document XML).
Une DTD ne permet pas de typer les données
Une DTD ne peut prendre en compte qu’un seul espace de nom (Namespace).

XML schema

En réponse aux lacunes des DTD, une alternative a été proposée comme recommandation : il s’agit de XML-Data dont XML-Schema est un sous-ensemble.

Cette nouvelle norme achève de faire d’XML un format pivot…

La version 1.1 de XML Schema (datée de mai 2001) se compose de 3 normes :

XML Schema tome 0 : Introduction
XML Schema tome 1 : Structures
XML Schema tome 2 : Types de données

Les documents XML-Schema sont des documents qui :

espectent la syntaxe XML,
peuvent décrire la structure d’un document XML d’une façon beaucoup plus complète que les DTD.

XML-Schema permet en effet de :

spécifier la typologie des données que va contenir le document XML décrit par le XML-Schema,
gérer une quarantaine de types de données simples,
gérer des types complexes,
gérer les occurrences des données.

Exemple

Document XML

<entree>
  <nom>Harry Potter</nom>
  <telephone>0102030405</telephone>
</entree>

Document XML-schema correspondant

<wsd:schema xmlns:xsd="http://www.w3org/2000/10/XMLSchema"> <!--entete-->
<xsd:element name="entree"> <!--Définition de la balise complexe "entree"-->
  <xsd:complexType>
    <xsd:sequence>
      <xsd:element name="nom" type="xsd:string" 
                   minoccurs="1" maxoccurs="1"/> <!-- Définition de la balise string "nom"-->
      <xsd/emement name="telephone" type="xsd:decimal"/> <!--Définition de la balise de type Décimal telephone-->
    </xsd:complexType>
  </xsd:element>
</xsd:schema>

Référence à un XML-Schema dans un document XML

<entree xmlns="http://www.annuaire.org"
     xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance"
     xsi:schemaLocation="http://www.annuaire.org/entree.xsd">
  <nom>Harry Potter</nom>
  <telephone>012030405</telephone>
</entree>

L’espace de nommage xsi correspond aux instances de documents XML respectant les contraintes définies dans un document XML-Schema. Le W3C a défini une librairie de balises et attributs pouvant être utilisés par ces documents.

La DTD permet de définir facilement et rapidement des grammaires simples.

XML-Schema permet de définir de manière plus formelle et complète une grammaire mais c’est au prix d’une complexité accrue.

Un document XML-Schema respecte la syntaxe XML.

Un document XML-Schema est généralement plus volumineux et plus difficile à lire qu’une DTD (pour un opérateur humain).

Exemple de XML-XSD

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<cave xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation='td2.xsd'>
<appellation id="01" nom="Saint Estèphe"> 
	<chateau id="0101">
		<nom> Chateau Bellevue</nom>
		<adresse> 12 Rue du Pont</adresse>
		<téléphone> 0556124321</téléphone>
	</chateau>
	<chateau id="0102">
		<nom> Chateau Le Bernadot</nom>
		<adresse> 21 Avenue du Cygne</adresse>
		<téléphone> 0556324231</téléphone>
	</chateau>	
</appellation>
</cave>
<?xml version="1.0" encoding="ISO-8859-1"?>
<xsd:schema xmlns:xsd='http://www.w3.org/2001/XMLSchema'>
 <xsd:element name="cave">
  <xsd:complexType>
   <xsd:sequence>
     <xsd:element ref="appellation" minOccurs='1' maxOccurs='unbounded'/>
   </xsd:sequence>
  </xsd:complexType>
  </xsd:element>
 
  <xsd:element name="appellation">
  <xsd:complexType>
   <xsd:sequence>
     <xsd:element ref="chateau" minOccurs='0' maxOccurs='unbounded'/>
   </xsd:sequence>
   <xsd:attribute name="id"  type="xsd:integer" use='required'/>
   <xsd:attribute name="nom" type="xsd:string"/>
  </xsd:complexType>
 </xsd:element>  
<xsd:element name="chateau">
  <xsd:complexType>
   <xsd:sequence>
     <xsd:element ref="nom" minOccurs='1' maxOccurs='1'/>
     <xsd:element ref="adresse"/>
     <xsd:element ref="téléphone"/>
   </xsd:sequence>
   <xsd:attribute name="id" type="xsd:integer" use='required'/>
  </xsd:complexType>
 </xsd:element>
 <xsd:element name="nom" type="xsd:string"/>
 <xsd:element name="adresse" type="xsd:string"/>
 <xsd:element name="téléphone" type="xsd:decimal"/>
 </xsd:schema>

TRANSFORMATION D’UN DOCUMENT XML

Les outils destinés à transformer les documents XML représentent ceux-ci comme un arbre de nœuds XML.

XSL est le langage qui permet d’écrire des feuilles de style. Une feuille de style est constituée d’un ensemble de règles de transformations, s’appliquant chacune à un ou plusieurs nœuds de l’arbre et permettant de transformer ce nœud en un nouveau nœud de l’arbre résultat.

XPath est le langage qui permet d’adresser une partie ou plusieurs parties d’un document, c’est à dire un ou plusieurs nœuds du document XML.

Transformation effectuée par un processeur XSL

Wiki direlo

Table des matières

Web et échange de données

Avènement du web

HTTP

Définition

Fonctionnement

Méthodes

Données

Problématique

W3C

Principales normalisations

XML

Définition

Caractéristiques

Exemple

Structure

SPECIFICATIONS

Arbre XML

Exemple

Arbre

JSON

Représentation

Exploitation

DTD

Définition

Exemple

DTD interne

DTD externe

XML schema

Exemple

Exemple de XML-XSD

TRANSFORMATION D’UN DOCUMENT XML