Comment gérer les caractères indésirables dans Sqoop


Prabhanj

Lors de l'importation de données du RDMS vers Hadoop à l'aide de sqoop. Si mon système source contient des caractères indésirables, comment pouvons-nous les remplacer

Par exemple: 1, jeu de mots, voyage,

Jagrut Sharma

La définition des caractères indésirables peut varier en fonction des données stockées et de l'utilisation des données. Sqoopimport permet de supprimer des Hivedélimiteurs (via --hive-drop-import-delimsoption) ou de remplacer des Hivedélimiteurs (via --hive-delims-replacementoption). D'autres formes de traitement des données devraient être effectuées une fois que le travail d'importation a reçu des données sur Hadoop.

Selon la documentation de Sqoop :

--hive-drop-import-delims: Drops \n, \r, and \01 from string fields when importing to Hive.
--hive-delims-replacement: Replace \n, \r, and \01 from string fields with user defined string when importing to Hive.

Articles connexes


Comment supprimer les caractères indésirables ?

utilisateur9293054 J'ai une table, dans une colonne, les données sont 'su@re#sh$', maintenant je veux sortir 'suresh'? Comment récupérer vous 74 Utilisation de regexp_replace : select regexp_replace('su@re#sh$', '[^0-9A-Za-z]', '') from dual (vous devrez met

Comment supprimer les caractères indésirables en python

dr.engg J'essaie d'appeler une API à partir de la sortie d'une requête, la sortie de la requête est int, mais lorsque j'appelle la requête, elle renvoie quelque chose comme [(12345,)],mais je veux seulement 12345comment reconstruire la sortie J'utilise une exp

Ansible: supprimer les caractères indésirables dans stdout

pkaramol J'exécute un jeu ansible où je veux analyser la sortie de la kubect cluser-infocommande. Ce que je m'attendais à obtenir, c'est: $ kubectl cluster-info Kubernetes master is running at https://192.168.60.11:6443 KubeDNS is running at https: