Accueil Méthodologie Méthodologie appariement

Le portefeuille de brevets (prioritaires) d’un groupe industriel est défini comme la réunion des brevets (prioritaires) déposés par le « Global Ultimate Owner » (GUO) et par l’ensemble de ses filiales consolidées - i.e. celles dans lesquelles le GUO a une participation totale supérieure ou égale à 50,01%.

La mise en oeuvre de cette règle requiert d’apparier, d’une part, les noms des GUO des groupes et des filiales extraits de la base de données financières utilisée (Orbis) et, d’autre part, les noms des déposants apparaissant dans les demandes de brevets. Un tel appariement automatisé, qui requiert une stricte identité entre les chaînes de caractères composant les termes recherchés, soulève deux types de difficultés.

Les difficultés liées au croisement de bases de données

Tout d’abord, une même entreprise peut apparaître avec des appellations et des graphies différentes dans la base de brevets. Par exemple: IBM et International Business Machines. Il est de ce fait délicat de regrouper les brevets déposés sous ces différentes formes sous un label unique. Cette difficulté a été surmontée en utilisant les noms harmonisés proposés dans la base de données Patstat (voir Données sources). Ceux-ci permettent de rassembler la plupart des différentes variations de l’appellation d’un même déposant sous une désignation unique, dite harmonisée.

La seconde difficulté découle du fait que le nom de déposant qui apparaît dans les documents de brevets ne correspond pas toujours exactement à l’appellation juridique de ce déposant (GUO ou filiales) telle que proposée par Orbis; laquelle peut également différer de la désignation commune de cette entité. Ainsi le groupe néerlandais  communément désigné comme « Philips » a un GUO dont l’appellation est Koninklijke Philips Electronics NV.

Une normalisation préalable à la comparaison de chaînes de caractères

La technique d’appariement qui a été retenue dans le projet Corporate Invention Board s’appuie sur les recherches de Tom Magerman de l’Université Catholique de Louvain. La méthodologie développée par ce chercheur en collaboration avec l’Organisation pour la coopération et le développement économique (OCDE), la direction générale Eurostat de la Commission européenne et l’Office européen des brevets (OEB) recouvre schématiquement deux étapes.
Tout d’abord, il est nécessaire de procéder à une étape de nettoyage orthotypographique visant, par exemple, à supprimer les doubles espaces apparaissant indûment entre deux mots ou les espaces blancs précédant une virgule.

Ensuite, les désignations légales des entreprises (telles que Ltd, Corp, Sa, Inc.) qui apparaissent systématiquement dans la base d’informations financières Orbis - mais rarement dans les données brevets -ont été supprimées afin d’améliorer le rapprochement entre les informations issues des bases de données brevets et financières.

Cette méthodologie d’appariement a permis d’identifier plus de 5 millions de brevets prioritaires déposés par les quelque 2400 groupes étudiés.

Une marge d’erreur réductible mais inévitable

Comme pour tout traitement massif de données, il serait illusoire de penser identifier sans méprise l’ensemble des brevets des groupes étudiés. L’objectif est de procéder à l’arbitrage le plus satisfaisant entre les faux positifs et les faux négatifs. Dans le premier cas, un brevet est attribué à tort à une entreprise ; alors que dans le second cas, le brevet déposé par une entreprise n’est pas identifié et ne peut donc pas être intégré dans son portefeuille de brevet.

Une marge d’erreur reste inévitable dans un tel travail d’identification automatisée. L’objectif est de réduire celle-ci lors des éditions ultérieures du Corporate Invention Board. D’abord à la faveur des progrès méthodologiques d’identification qui permettront d’améliorer les appariements entre les appellations, ensuite grâce aux améliorations apportées à la base de données Patstat (voir Données sources). Ensuite grâce aux interactions que nous souhaitons engager avec les groupes étudiés dans le cadre de cette première édition du Corporate Invention Board.