Découvrir des modèles de criminalité à l'aide de données de localisation

La façon dont les gens se déplacent dans les villes nous donne des indices sur le moment où de nombreux crimes sont commis et sur les points chauds, comme l'ont démontré des scientifiques de l'ETH Zurich en utilisant des données anonymes provenant de plateformes technologiques de localisation.
Image satellite de la ville de Philadelphie. Sur la base des données de localisation, les scientifiques ont constaté que les zones disposant d'une plus grande mobilité sont également celles où la criminalité augmente. (Image : ©Halina - stock.adobe.com)

Quand et où la criminalité se manifeste-t-elle dans les villes ? Pour répondre à cette question, les criminologues se sont jusqu'à présent appuyés sur des modèles plutôt statiques. La criminalité a été associée à la composition de la population résidente d'un quartier ou à l'utilisation des zones respectives. Jusqu'à présent, on ne savait pas quelle influence la mobilité a sur le développement de la criminalité.

Mais aujourd'hui, des chercheurs de l'ETH Zurich, de l'Université de Cambridge et de l'Université de New York ont pu démontrer pour la première fois que la criminalité est directement liée au nombre de personnes dans une ville, à l'endroit où elles se trouvent et à où elles vont. Cristina Kadar, informaticienne et ancienne doctorante du Mobiliar Lab for Analytics de l'ETH Zurich, a dirigé l'étude. Elle a récemment présenté les résultats lors d'une conférence (virtuelle) sur les sciences sociales computationnelles.

Analyse des flux de mobilité

Les scientifiques ont calculé les flux de mobilité à partir de données de localisation agrégées et anonymisées. Dans leur étude, ils ont utilisé trois ensembles complets de données anonymisées concernant les villes de San Francisco, Chicago et Philadelphie pour les années 2012 et 2013. Ils ont obtenu les informations de la plateforme de localisation Foursquare, qui repose sur des millions de «check-ins», c'est-à-dire des lieux que les utilisateurs ont activement partagés. Avant de mettre les données à la disposition des scientifiques, l'entreprise s'est assurée que les données personnelles et tous les enregistrements des utilisateurs avaient été supprimés.

Dans leur analyse, les scientifiques ont comparé les ensembles de données avec les statistiques de criminalité de la même période, en se concentrant spécifiquement sur les infractions relatives au vol, au vol qualifié, aux agressions, au cambriolage et aux véhicules volés.

Plus d'activité, plus de criminalité

Résultat : plus les données de la plateforme ont montré d'activité pendant un certain temps et dans un certain district, plus les scientifiques ont trouvé d'infractions.

Pour calculer l'«activité», ils ont inclus les enregistrements dans les restaurants, les magasins ou les installations sportives, ainsi que les cas de personnes passant par un district donné entre deux enregistrements. Leurs calculs des trajets entre deux enregistrements se sont basés sur l'hypothèse que les utilisateurs choisissent le chemin le plus court et naviguent en utilisant les voies de circulation existantes.

Le danger se cache sur la route

En fait, ce sont ces trajets intermédiaires qui ont la plus grande influence sur les taux de criminalité. En d'autres termes, la criminalité est plus susceptible de se produire dans les zones que les gens traversent entre deux activités de routine, par exemple sur le chemin du travail aux magasins ou pour participer à des activités de loisirs. Les résultats confirment une théorie populaire de la criminologie selon laquelle les crimes se produisent là où les chemins des auteurs et des victimes se croisent.

«Je suis ravie que nous puissions utiliser des données qui n'ont essentiellement rien à voir avec les infractions pénales pour caractériser de cette manière la criminalité», déclare Cristina Kadar. Jamais auparavant nous n'avons pu démontrer le lien entre la mobilité des personnes et la criminalité d'une manière aussi granulaire en termes de temps et d'espace, explique-t-elle.

Les scientifiques ont également segmenté leur analyse par type d'activité et d'infraction. Il en ressort que davantage de crimes ont été enregistrés dans des lieux et des périodes comportant un grand nombre d'activités de loisirs, mais que ce n'était pas le cas pour les achats, par exemple. En ce qui concerne le type d'infraction commise, les scientifiques ont constaté la relation positive la plus forte avec les vols, et la plus faible avec les cambriolages.

Prévisions également possibles

En outre, ils ont examiné s'il serait possible d'utiliser les données sur la mobilité pour prévoir la criminalité à l'aide du machine learning. Pour ce faire, ils ont formé différents modèles, une fois avec les ensembles de données de Foursquare et une fois seulement avec les données sur les infractions passées. Ensuite, ils ont vérifié l'exactitude des prévisions par rapport aux délits réels enregistrés. Ils ont découvert que les modèles de prédiction alimentés par les données de mobilité étaient nettement plus performants que les prédictions basées sur les délits passés.

Soutien à la recherche

Cristina Kadar voit son étude avant tout comme un moyen de soutenir la recherche. En fournissant des preuves pour la théorie des schémas de criminalité, elle contribue à améliorer la compréhension des origines de la criminalité. Elle estime que son travail démontre également l'utilité du big data pour les sciences sociales computationnelles, mais note que d'autres études sont nécessaires pour valider les résultats avant que les autorités publiques puissent les appliquer à la conception et à la construction de villes plus sûres. En effet, l'analyse doit être réexaminée avec un certain nombre d'ensembles de données différents afin de calibrer tout biais potentiel de la plate-forme. Et bien que les résultats de l'étude puissent être appliqués aux grandes villes, ils pourraient ne pas être pertinents pour les petites villes.