![跟李锐学Excel数据分析](https://wfqqreader-1252317822.image.myqcloud.com/cover/480/41151480/b_41151480.jpg)
2.1 TXT文件中的数据,如何批量导入Excel
在实际工作中,很多平台和系统导出的数据都是TXT格式的,那么我们就从文本文件数据的导入开始介绍吧。
为了能游刃有余地应对各种情况,下面结合4个案例展开介绍。
2.1.1 常规文本文件数据的导入
需要导入的文本文件如图2-1所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_30_0_m.jpg?sign=1739618498-PmZHvXo07bOnLrlQKQFF76r9fRRQlVNo-0-46984075b7b04c3b26b8b34197bc321f)
图2-1
要在Excel中导入文本文件中的数据,有两种方法,一种是利用文本导入工具,另一种是借助Power Query工具,前者是Excel各个版本通用的方法,后者是Excel 2016、Excel 2019和Office 365版本的内置功能,如果使用的是Excel 2013或Excel 2010,需要从微软公司官网下载并安装Power Query插件。
下面就这两种方法,分别展开介绍。
■ 方法一:利用文本导入工具导入
在Excel 2019版本中,文本导入工具位于“数据”选项卡下面的“获取外部数据”组中,如图2-2所示。我们可以调用此工具进行文本数据的导入,方法如下。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_31_0_m.jpg?sign=1739618498-xDTFHr8KDcvqDiJE5OVSBCA5bU3ggByz-0-63dfeff9486e80923533fea27a81f44e)
图2-2
01 打开要放置文本数据的Excel工作簿,单击A1单元格,然后单击“数据”选项卡下的“自文本”按钮,弹出“导入文本文件”对话框,选择文本文件所在位置,单击“导入”按钮,如图2-3所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_31_1_l.jpg?sign=1739618498-MrAEEVzROyBmVeEtLF98hq1x4BySpKmU-0-b99a793d3b0ed7f61ebb8d59b35b381c)
图2-3
02 在文本导入向导的第1步中,按图2-4所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_32_0_m.jpg?sign=1739618498-0mSy60m5FMV5cRZkD3VCfFIzV6hG0m9F-0-23d70110fd89e302655b8a9d519c854f)
图2-4
03 进入文本导入向导的第2步,按图2-5所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_32_1_m.jpg?sign=1739618498-wQlXr8R5E0YtrbxW0yI4Z6WVjXG4jR5J-0-7ddb695b285d0e0712ecb699d4106827)
图2-5
04 进入文本导入向导的第3步,按图2-6所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_33_0_m.jpg?sign=1739618498-WBN94LE8xFjbGHPPqQIWlfExIXaMuOXb-0-0e6ac5d832646da1773d019b806d57c7)
图2-6
05 完成文本导入的操作后,设置数据的放置位置,如图2-7所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_33_1_m.jpg?sign=1739618498-qIIXubNaXxFZ5q6zwblGTF99fqWkk28K-0-6b9cb871fa6293401c7bf931676e0364)
图2-7
06 将数据导入Excel后的效果如图2-8所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_34_0_m.jpg?sign=1739618498-wt4mP9TNRKqzRbUzA6YKTVFDrRNYRqnF-0-c6d26419b0bfa356c260092b9d75bd3b)
图2-8
■ 方法二:借助Power Query工具导入。
01 单击“数据”选项卡下的“新建查询”按钮→“从文件”→“从文本”,如图2-9所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_34_1_m.jpg?sign=1739618498-yF4JheUBCibO2E3Au5kcygupV7AUnbWB-0-af35c89ff19e677776f37b7ef7a4de32)
图2-9
02 在弹出的对话框中选择要导入的文本文件所在位置,单击“打开”按钮。
03 在弹出的Power Query导入界面中,按图2-10所示步骤操作,加载数据。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_35_0_m.jpg?sign=1739618498-dOVKHvBlz8JvpLzoxlNQ3SKz0hQWYqvV-0-8604668a852dd31d91b173a5201e5e15)
图2-10
04 加载数据后的效果如图2-11所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_35_1_l.jpg?sign=1739618498-vIlV012zDrOS6JpW4AyTyLi1IpSsj56x-0-ca0161a562018908c40a7a41679d2460)
图2-11
你会发现,Excel默认将数据创建为超级表而非普通区域。
虽然以上两种方法都可以导入文本文件中的数据,但是显然方法二(借助Power Query导入数据)更加快捷。
不仅如此,当文本文件中的数据变更或向其中追加新的数据时,使用方法二导入Excel中的结果还支持同步更新,仅需单击“刷新”按钮即可,如图2-12所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_0_l.jpg?sign=1739618498-Wmu7Uvbi20h00Pt3BrYPVeJSnF3NxYmW-0-26ee814e65357d6f139d70a490c06b93)
图2-12
小结
推荐使用Excel 2016、Excel 2019或Office 365版本的用户优先使用Power Query导入文本文件中的数据,低版本用户使用方法一导入数据。
2.1.2 身份证号码等长文本数据的导入
除了常规的数据,实际工作中还可能遇到一些特殊数据,如身份证号码或银行账号等位数较多的数字,这时如果还按照上一小节介绍的步骤导入,会导致部分数据丢失。
下面结合一个案例说明关键步骤的设置方法。
现在有大量18位数字的身份证号码需要导入Excel,由于篇幅有限,仅展示前10行数据,如图2-13所示(已对身份证号码进行脱敏处理)。
由于身份证号码为18位数字,使用常规方法进行导入时,Excel默认只保留15位数字,这样会导致所有身份证号码的后3位数字变为0,如图2-14所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_2_m.jpg?sign=1739618498-SJk8LBoVvqYyIqXUa3kpsYAFKxjVZQbp-0-3c9b5d4fab8d79252e993fb84b5b859c)
图2-13
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_3_m.jpg?sign=1739618498-ALg6ZcmxggPANOs8zpfVReXizryCQHgX-0-4b732b016ac6a276d0b06f1cfa7013bb)
图2-14
为了避免这种情况的发生,需要在导入数据时指定身份证号码列按文本格式导入,下面分两种方法介绍关键的设置步骤。
■ 方法一:利用文本导入工具导入
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中选中身份证号码所在的列,将其设置为文本格式,单击“完成”按钮,如图2-15所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_37_0_m.jpg?sign=1739618498-0GgW4LLCcgX0jtb0iizLB92uO1sGWSn7-0-681a5b378b00e3b70ca1fe941f0d7b0c)
图2-15
02 这样设置后才能完整地导入身份证号码,如图2-16所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_37_1_m.jpg?sign=1739618498-WRroAV6fGRWwUAacCXEswkOh4E2hK2wu-0-4c92dc2132f67158d75e7ff0564d0f03)
图2-16
■ 方法二:借助Po wer Query工具导入
01 参照2.1.1小节图2-9所示的操作,进入Power Query导入界面后,可见身份证号码列的数字变为科学记数法显示,所以这时不能直接单击“加载”按钮,而要单击“转换数据”按钮,如图2-17所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_38_0_m.jpg?sign=1739618498-UgdQALSNglwFK0vJKcZaeHHNJ6pwpy3U-0-2f9a351bd9eb536ab3c7e5ff4006030a)
图2-17
02 进入Power Query编辑器后,界面如图2-18所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_38_1_l.jpg?sign=1739618498-FGjIjcCkKDHr9jluZTje7BFv7VGsqOWb-0-96cf17dce8f43973136867db22cfc4ad)
图2-18
03 选中身份证号码所在的列,将其转换为文本格式,如图2-19所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_0_l.jpg?sign=1739618498-k39W8ggfCuYonMoAkPMz2kfwZF9xOwlT-0-21524a24dbf9a16117536198ff35bba5)
图2-19
04 在弹出的对话框中单击“替换当前转换”按钮,如图2-20所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_3_m.jpg?sign=1739618498-GXvFiYUciwfhkiceK0Sy01qHzCLs1q1Z-0-6fb0232f3531ac82ccbb63fa384dfff2)
图2-20
05 转换成功后,即可完整显示18位身份证号码,单击“关闭并上载”按钮,将Power Query中的转换结果导入Excel中,如图2-21所示。
06 将数据导入Excel中的结果如图2-22所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_1_m.jpg?sign=1739618498-qx5xTdLoQr9bdrVqsxoqiLLZ6Vy4rf1B-0-9bf04132c1085877b81c3ffe6486e191)
图2-21
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_2_m.jpg?sign=1739618498-Dgc17uiaDUbofYvFC8QPtie8VN7RkURa-0-6fc9a2a707f489f4579d3cfcdb72f428)
图2-22
Excel中的这个结果同样也是支持跟随数据源刷新的,当文本文件中的数据源变动后,在Excel中单击“设计”选项卡下的“刷新”按钮即可同步更新。
2.1.3 从十几个文本字段中删除部分字段再导入Excel
前面两个案例都是将文本文件中所有字段数据导入Excel,实际工作中有时我们只需要数据中的一部分字段,所以可以从数据中删除部分字段再导入。
原始文本文件如图2-23所示。其中的“退款额”和“退货量”无须导入Excel。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_40_0_l.jpg?sign=1739618498-wXdVN9sRj7BLPc8tYuaxgz6Sq45xJCvr-0-f6f8ae35efcc44b5bb6a3dc1b072f2d3)
图2-23
下面依然分两种方法展开介绍。
■ 方法一:利用文本导入工具导入
由于前面已经介绍过文本导入工具,所以这里重复的步骤不赘述。
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中,依次选中无须导入的字段所在的列,选中“不导入此列(跳过)”单选项,单击“完成”按钮,如图2-24所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_40_1_m.jpg?sign=1739618498-S2gV3P3f6fL25e4QmvcZBV2gF3P49aa5-0-ccda5901739288581592fc8a83d17ebf)
图2-24
02 这样即可忽略无须导入的字段,将数据导入Excel中,如图2-25所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_41_0_m.jpg?sign=1739618498-25oGVPgX3fBqLC2h3WA8P2YQO0nStohG-0-5f4526ac64fa2f4da23ee8465b911da1)
图2-25
■ 方法二:借助Power Query工具导入
01 在“数据”选项卡下单击“从文本/CSV”按钮,将文本文件中的数据导入Power Query。在Power Query导入界面单击“转换数据”按钮,如图2-26所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_41_1_l.jpg?sign=1739618498-iDazorczJIuw56jSYT2K5n1qRBTJAvGx-0-54091fd5801f4b10dc8eddd15786859f)
图2-26
02 在Power Query编辑器中,按住<Ctrl>键不松开并依次选中无须导入的两列,单击“删除列”按钮,如图2-27所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_0_l.jpg?sign=1739618498-H9i8l2QLIkq2HquCXXIS5fOpYMmjgeBc-0-2f9af98d0fd6227616615e7b5cb31f10)
图2-27
03 单击“关闭并上载”按钮将Power Query中的转换结果导入Excel中,如图2-28所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_1_l.jpg?sign=1739618498-A3UI8dqDfwfmGHR503BGeXo3pyfxC11N-0-e65b28f1f25141ee6075ac2add6f7b46)
图2-28
04 Excel中的结果如图2-29所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_2_l.jpg?sign=1739618498-36n1weyCluS36ChsmP5ztTyEJLTAmo5a-0-fb07e3022d33fded704b74391b9c3d56)
图2-29
2.1.4 从字段中选择性导入数据
当文本文件中需要删除的字段太多时,我们可以仅选择需要导入的字段进行导入。
原始文件中包含几十列数据,如图2-30所示,仅需导入前面的从“日期”至“转化率”的10个字段,后面的几十个字段数据无须导入。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_43_0_l.jpg?sign=1739618498-r1W5K9VAphdcUDzACOZnBTisjpvRxbxw-0-bc3ff1a736b172030173b5d222181063)
图2-30
下面依然分两种方法展开介绍。
■ 方法一:利用文本导入工具导入
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中(如图2-31所示),先单击“退款额”所在的列,再按住鼠标左键不松开并向右拖动底部的滚动条直至最后一列。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_43_1_m.jpg?sign=1739618498-7oPHDOdb2sSXl3EIRHRLfcYIIJOeMWD2-0-8f4afc35166b3ff8a3271f87e94bf74b)
图2-31
02 按住<Shift>键不松开并单击最后一列(“星期”字段所在的列),目的是选中从“退款额”至“星期”的连续几十列,然后选中“不导入此列(跳过)”单选项,单击“完成”按钮,如图2-32所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_44_0_m.jpg?sign=1739618498-RQAVTot1WmbUKxwoSLgdxNZ3GpdJsenf-0-f4870465689a1976c0f5176b2e7db62b)
图2-32
03 这样即可忽略无须导入的几十列,仅导入有效数据,如图2-33所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_44_1_m.jpg?sign=1739618498-uqsqa7je72ZiFUvCPhT6N0uIdbmxHzvO-0-9d77d5f5d61d6a9ae32798d289e7056f)
图2-33
■ 方法二:借助Power Query工具导入
01 参照2. 1.2小节图2-9、图2-10所示的操作,将数据导入Power Query编辑器后,按住<Shift>键不松开并依次单击“日期”列和“转化率”列,目的是选中这些需要导入的连续多列数据,然后单击“删除列”按钮的下半部分,在弹出的下拉菜单中选择“删除其他列”,如图2-34所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_0_l.jpg?sign=1739618498-QEhknGRpLUOUpP8uX6N40zOkVAiL1XTv-0-a343ff589da5ea1d2b7e065c63062146)
图2-34
02 在Power Query中转换得到想要的结果后,单击“关闭并上载”按钮,如图2-35所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_1_l.jpg?sign=1739618498-82SqNCCjEovvm9WXWNYkk6V94BrcXmOM-0-db166f038e5b9d85a3b4f63f26e5e2b4)
图2-35
03 Excel中的效果如图2-36所示。
当然,借助Power Query导入的这些数据,可以借助“刷新”功能使之与数据源保持同步更新,这也是使用Power Query的极大优势所在。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_2_l.jpg?sign=1739618498-uDpNUKMReeVCL71sHWPHEkOMN2WKvylH-0-6402bc6869522153e039af8015f10121)
图2-36