comment distinguer la provenance des métadonnées moissonnées ?

classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

comment distinguer la provenance des métadonnées moissonnées ?

Matthieu Noucher
Bonjour,

Dans le cadre du projet de recherche GEOBS
(http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos
chantiers est consacré à l'étude du contenu des géocatalogues régionaux
et nationaux.

Après avoir testé nos analyses des couvertures thématiques,
organisationnelles, temporelles et spatiales des métadonnées sur 3
géocatalogues régionaux, nous essayons désormais d'automatiser la
démarche pour sortir des indicateurs sur l'ensemble des 45
infrastructures nationales et régionales qui constituent notre corpus
initial. Pour ce faire, nous nous appuyons sur les services web CSW pour
récupérer les balises qui nous intéressent. Le problème c'est que
lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les
métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue
moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous
récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il
moissonne TOUT le géocatalogue !

J'ai trouvé dans certaines fiches de métadonnées la suite de balises
ci-dessous qui permet d'identifier clairement de quel catalogue provient
la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :

/<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv"
xmlns:date="http://exslt.org/dates-and-times">//
//    <gmd:MD_FeatureCatalogueDescription>//
//      <gmd:includedWithDataset />//
//      <gmd:featureCatalogueCitation
uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290"
xlink:href="http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290"
/>//
//    </gmd:MD_FeatureCatalogueDescription>//
//</gmd:contentInfo>/

Mais malheureusement cette suite de balise est absente de la plupart des
fiches de métadonnées.... Du coup je ne vois pas comment repérer
l'information sur leur provenance. Auriez-vous une idée ?

Merci d'avance.

--
Matthieu NOUCHER
Chargé de recherche au CNRS
Laboratoire ADESS (UMR 5185)

Maison des Suds
12 esplanade des Antilles
F-33607 Pessac Cedex

Tél : 00.33 (0)5.56.84.82.06
Mail : [hidden email]
Web (labo)  : http://www.ades.cnrs.fr
Web (perso) : http://www.ades.cnrs.fr/spip.php?article803

------------------------------------------------------------------------------
Presto, an open source distributed SQL query engine for big data, initially
developed by Facebook, enables you to easily query your data on Hadoop in a
more interactive manner. Teradata is also now providing full enterprise
support for Presto. Download a free open source copy now.
http://pubads.g.doubleclick.net/gampad/clk?id=250295911&iu=/4140
_______________________________________________
GeoNetwork-users-fr mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr
Reply | Threaded
Open this post in threaded view
|

Re: comment distinguer la provenance des métadonnées moissonnées ?

Francois Prunayre
Bonjour,

Le 16 novembre 2015 à 22:32, Matthieu Noucher <[hidden email]> a
écrit :

>
> Bonjour,
>
> Dans le cadre du projet de recherche GEOBS
> (http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos
> chantiers est consacré à l'étude du contenu des géocatalogues régionaux
> et nationaux.
>
> Après avoir testé nos analyses des couvertures thématiques,
> organisationnelles, temporelles et spatiales des métadonnées sur 3
> géocatalogues régionaux, nous essayons désormais d'automatiser la
> démarche pour sortir des indicateurs sur l'ensemble des 45
> infrastructures nationales et régionales qui constituent notre corpus
> initial. Pour ce faire, nous nous appuyons sur les services web CSW pour
> récupérer les balises qui nous intéressent. Le problème c'est que
> lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les
> métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue
> moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous
> récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il
> moissonne TOUT le géocatalogue !
>
> J'ai trouvé dans certaines fiches de métadonnées la suite de balises
> ci-dessous qui permet d'identifier clairement de quel catalogue provient
> la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :
>
> /<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv"
> xmlns:date="http://exslt.org/dates-and-times">//
> //    <gmd:MD_FeatureCatalogueDescription>//
> //      <gmd:includedWithDataset />//
> //      <gmd:featureCatalogueCitation
> uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290"
> xlink:href="
http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290
"
> />//
> //    </gmd:MD_FeatureCatalogueDescription>//
> //</gmd:contentInfo>/
>
> Mais malheureusement cette suite de balise est absente de la plupart des
> fiches de métadonnées.... Du coup je ne vois pas comment repérer
> l'information sur leur provenance. Auriez-vous une idée ?


Le CSW ne fournit pas d'information sur le catalogue d'origine de la fiche.
Vous pourriez utiliser le protocol GeoNetwork qui ajoute cette information
dans le ZIP échangé lors du moissonnage. En CSW, le moins pire est sans
doute d'utiliser l'information sur l'auteur de la fiche, mais ce ne sera
pas forcément correct.

La prochaine version de l'ISO19115-3 ajoute cette notion avec un élément
permettant de créer un lien vers la fiche dans son catalogue d'origine
(metadataLinkage également appelé pointOfTruthUrl dans certains profiles).

Salutations.

Francois




>
>
> Merci d'avance.
>
> --
> Matthieu NOUCHER
> Chargé de recherche au CNRS
> Laboratoire ADESS (UMR 5185)
>
> Maison des Suds
> 12 esplanade des Antilles
> F-33607 Pessac Cedex
>
> Tél : 00.33 (0)5.56.84.82.06
> Mail : [hidden email]
> Web (labo)  : http://www.ades.cnrs.fr
> Web (perso) : http://www.ades.cnrs.fr/spip.php?article803
>
>
------------------------------------------------------------------------------
> Presto, an open source distributed SQL query engine for big data,
initially
> developed by Facebook, enables you to easily query your data on Hadoop in
a
> more interactive manner. Teradata is also now providing full enterprise
> support for Presto. Download a free open source copy now.
> http://pubads.g.doubleclick.net/gampad/clk?id=250295911&iu=/4140
> _______________________________________________
> GeoNetwork-users-fr mailing list
> [hidden email]
> https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr
------------------------------------------------------------------------------
_______________________________________________
GeoNetwork-users-fr mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr
Reply | Threaded
Open this post in threaded view
|

Re: comment distinguer la provenance des métadonnées moissonnées ?

Francois Prunayre
In reply to this post by Matthieu Noucher
Bonjour, un complément concernant la notion d'indicateur

Le 16 novembre 2015 à 22:32, Matthieu Noucher <[hidden email]> a
écrit :

> Bonjour,
>
> Dans le cadre du projet de recherche GEOBS
> (http://www-iuem.univ-brest.fr/pops/projects/geobs), l'un de nos
> chantiers est consacré à l'étude du contenu des géocatalogues régionaux
> et nationaux.
>
> Après avoir testé nos analyses des couvertures thématiques,
> organisationnelles, temporelles et spatiales des métadonnées sur 3
> géocatalogues régionaux, nous essayons désormais d'automatiser la
> démarche pour sortir des indicateurs sur l'ensemble des 45
> infrastructures nationales et régionales qui constituent notre corpus
>

Vous pourriez être intéressé par cet outil pour le calcul et le rendu
d'indicateurs.
https://github.com/INSPIRE-MIF/daobs

Site de démo
http://apps.titellus.net/dashboard/#/

Salutations.

Francois





> initial. Pour ce faire, nous nous appuyons sur les services web CSW pour
> récupérer les balises qui nous intéressent. Le problème c'est que
> lorsqu'on attaque les géocatalogues par les CSW, on récupère toutes les
> métadonnées (c'est-à-dire celles du catalogue et celles que le catalogue
> moissonne). Par exemple, dans le cas de PEIGEO (La Réunion), nous
> récupérons ainsi près de 57255 fiches car en plus de leur 87 fiches il
> moissonne TOUT le géocatalogue !
>
> J'ai trouvé dans certaines fiches de métadonnées la suite de balises
> ci-dessous qui permet d'identifier clairement de quel catalogue provient
> la métadonnée (ici une fiche d'Atlasanté moissonné par GeoGuyane) :
>
> /<gmd:contentInfo xmlns:srv="http://www.isotc211.org/2005/srv"
> xmlns:date="http://exslt.org/dates-and-times">//
> //    <gmd:MD_FeatureCatalogueDescription>//
> //      <gmd:includedWithDataset />//
> //      <gmd:featureCatalogueCitation
> uuidref="c1ca910a-7afa-4adf-adbe-573de6b5f290"
> xlink:href="
> http://www.atlasante.fr/geonetwork/srv/fre/csw?service=CSW&amp;request=GetRecordById&amp;version=2.0.2&amp;outputSchema=http://www.isotc211.org/2005/gmd&amp;elementSetName=full&amp;id=c1ca910a-7afa-4adf-adbe-573de6b5f290
> "
> />//
> //    </gmd:MD_FeatureCatalogueDescription>//
> //</gmd:contentInfo>/
>
> Mais malheureusement cette suite de balise est absente de la plupart des
> fiches de métadonnées.... Du coup je ne vois pas comment repérer
> l'information sur leur provenance. Auriez-vous une idée ?
>
> Merci d'avance.
>
> --
> Matthieu NOUCHER
> Chargé de recherche au CNRS
> Laboratoire ADESS (UMR 5185)
>
> Maison des Suds
> 12 esplanade des Antilles
> F-33607 Pessac Cedex
>
> Tél : 00.33 (0)5.56.84.82.06
> Mail : [hidden email]
> Web (labo)  : http://www.ades.cnrs.fr
> Web (perso) : http://www.ades.cnrs.fr/spip.php?article803
>
>
> ------------------------------------------------------------------------------
> Presto, an open source distributed SQL query engine for big data, initially
> developed by Facebook, enables you to easily query your data on Hadoop in a
> more interactive manner. Teradata is also now providing full enterprise
> support for Presto. Download a free open source copy now.
> http://pubads.g.doubleclick.net/gampad/clk?id=250295911&iu=/4140
> _______________________________________________
> GeoNetwork-users-fr mailing list
> [hidden email]
> https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr
>
------------------------------------------------------------------------------
Site24x7 APM Insight: Get Deep Visibility into Application Performance
APM + Mobile APM + RUM: Monitor 3 App instances at just $35/Month
Monitor end-to-end web transactions and take corrective actions now
Troubleshoot faster and improve end-user experience. Signup Now!
http://pubads.g.doubleclick.net/gampad/clk?id=267308311&iu=/4140
_______________________________________________
GeoNetwork-users-fr mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/geonetwork-users-fr