智能识别省市区县
智能识别省市区县
一列地址,怎么拆成省、市、区县三列?
你手里有一份 Excel,里面有一列"门店地址"——"广东省深圳市南山区科技园路1号""北京市朝阳区望京街道88号"……几千条。
老板说:"按省份统计一下门店数量。"你一看,地址是一整串文字,没有单独的省、市、区县列。手动拆?几千条,拆到明天也拆不完。
「智能识别省市区县」就干这件事:你选一列地址,它自动从里面把省、市、区县识别出来,拆成三列新字段。拆完直接导出,拿去做透视表、做分组统计、做地图着色,随你用。
不调 API、不联网、不限行数,纯本地识别。
你需要准备什么
- 一份 Excel 或 CSV 文件,里面有一列包含地址信息的字段
- 地址越完整越好(带省市区县前缀),比如"广东省深圳市南山区xxx路"比"科技园路1号"识别率高得多
跟着走
第一步:打开工具
在左侧菜单点「地理数据分析工具箱」—— 顶部选「数据转换」Tab —— 找到「智能识别省市区县」卡片,点进去。
你会看到一个两步向导页面:步骤1-导入数据 / 步骤2-执行&结果。
第二步:导入数据
把你的 Excel 或 CSV 文件拖到页面中间的虚线框里,或者点「选择文件」手动选。
导入成功后,右上角会弹一个绿色提示"导入成功 · 3,000 行 × 8 列"(你的数字会不同),同时下方出现一个「字段映射」卡片。
第三步:选地址列
在「字段映射」卡片里,找到「地址列」下拉框。
系统会自动猜测哪一列是地址 —— 如果你的列名里带"地址""address""addr"这类关键词,它大概率猜得对。如果没猜对,手动点下拉框选一下。
到这里,你的屏幕应该是这样的:上方是步骤条,中间是导入卡片(显示文件名),下面是字段映射卡片(地址列已选好)。
⚠️ 这里很多人会犯一个错:选错了列。比如选了"门店名称"而不是"门店地址"。识别出来全是空的,以为是 Bug。选列的时候瞄一眼下拉框里的列名,确认选的是那个带完整地址的列。
第四步:跳到第二步,开始识别
点步骤条上的「下一步」,进入第二步页面。
点「开始识别省市区县」按钮。按钮上会出现进度条,几千条数据通常几秒钟就跑完了。
跑完后,按钮恢复正常,上方出现一行绿色摘要文字:"处理完成:共 3,000 条,识别成功 2,856 条,未识别 144 条,耗时 1.23s"(你的数字会不同)。
下方会出现一张结果预览表 —— 你会看到原来的数据后面多了三列:
| 列名 | 含义 | 示例 |
|---|---|---|
parsed_province | 省 / 自治区 / 直辖市 | 广东省 |
parsed_city | 地级市 / 州 / 盟 | 深圳市 |
parsed_district | 区 / 县 / 旗 | 南山区 |
💡 说到这里要特别提醒你:如果"未识别"的数量偏多,多半是因为原始地址太短或缺少省市前缀。比如"科技园路1号"——系统不知道这是深圳的科技园还是西安的科技园,所以识别不出来。解决办法:回到原始数据,把省市信息补上,再跑一次。
第五步:导出结果
确认预览没问题后,点下方的「导出结果」按钮。
系统会弹出标准的保存对话框,你可以选 Excel 或 CSV 格式保存。导出的文件和你导入的一模一样,只是多了 parsed_province、parsed_city、parsed_district 三列。
做完了,检查一下
如果你在预览表里看到地址后面多了三列省、市、区县,而且绝大部分都填上了值——说明地址拆分已经完成了。
接下来,你可以试试:
