Paquet elasticHal.libs

Modules

elasticHal.libs.archivesOuvertes

elasticHal.libs.archivesOuvertes.explain_domains(dom_uri)

Recherche le domaine parent d’un domaine dom_uri

elasticHal.libs.archivesOuvertes.explore_broader(uri)

Recherche le domaine parent d’un domaine donné

elasticHal.libs.archivesOuvertes.extrait_sujets_domaines(data)

À partir des données d’un l’article, extrait les sujets et domaines

elasticHal.libs.archivesOuvertes.get_aurehalId(authIdHal_s)

get the aurehalId (authIdHal_i) of the searcher with authIdHal_s (halId_s)

elasticHal.libs.archivesOuvertes.get_concepts_and_keywords(aurehalid)

Récupère les concepts et mots-clés d’un auteur à partir de son aurehalid

elasticHal.libs.archivesOuvertes.get_halid_s(aurehal_id)

Récupération du authidhal_s associé au aurehal_id depuis HAL

elasticHal.libs.archivesOuvertes.get_label(label, lang)

Récupére le nom complet d’un label en fonction de la langue associée

elasticHal.libs.archivesOuvertes.recup_individu(authidhal_s)

recupération des données d’un individu à partir de son authidhal_s

elasticHal.libs.dimensions

elasticHal.libs.dimensions.getCitations(doi)

Récupération des citations d’un article

elasticHal.libs.doi_enrichissement

elasticHal.libs.doi_enrichissement.check_doi(doi)

La fonction plancte avec une erreur sur certains URL qui n’est pas attrapée par le try except// Vérifie si le doi renseigné existe dans la base de données de doi.org

elasticHal.libs.doi_enrichissement.docs_enrichissement_doi(doc)

Enrichissement des documents avec les informations provenant du DOI

elasticHal.libs.hal

elasticHal.libs.hal.find_publications(idhal, field, increment=0)

Cherche les publications d’un auteur dans HAL à partir de son IDHAL

elasticHal.libs.hal.get_content(hal_url)

Récupère le contenu d’un article HAL à partir de son URL

elasticHal.libs.keyword_enrichissement

elasticHal.libs.keyword_enrichissement.keyword_from_teeft(txt, lang)

Enrichissement des mots clés avec les entités trouvées dans les résumés à partir de TEEFT

elasticHal.libs.keyword_enrichissement.return_entities(txt, lang)

Enrichissement des documents avec les entités trouvées dans les résumés à partir de la terminologie de loterre

elasticHal.libs.location_docs

elasticHal.libs.location_docs.generate_countrys_fields(doc)
Enrichi les notices avec les champs country_collaboration qui fusionne :

« deptStructCountry_s », –> Structure/regroupement d’équipes : Pays « labStructCountry_s », –> Structure/laboratoire : Pays « structCountry_s », –> Structure/regroupement d’institutions : Pays « structCountry_t »,–> Structure : Pays ( copie de ce champ : structCountry_s) !!!! « rgrpInstStructCountry_s »,–> Structure/regroupement d’institutions : Pays « rgrpLabStructCountry_s »–> Structure/regroupement de laboratoires : Pays

el le champs country_origin fusionnant :

country_s, –> Pays (Code ISO 3166) rteamStructCountry_s –> Structure/équipe de recherche : Pays instStructCountry_s –> Structure/institution : Pays

en se basant sur les métadonnées Hal du document

elasticHal.libs.utils

elasticHal.libs.utils.append_to_tree(scope, rsr, tree, state)

Rajoute un domaine d’expertise à un arbre d’expertise

elasticHal.libs.utils.calculate_mds(doc)

Attribue un score à la qualité de description d’une notice.

elasticHal.libs.utils.filter_concepts(concepts, validated_ids)

Filtre les concepts qui ne sont pas dans la liste des concepts validés

elasticHal.libs.utils.remove_page(pdf_file, pages)

Supprime des pages d’un pdf

elasticHal.libs.utils.should_be_open(doc)

Détermine si une notice devrait être ouverte