- 跟李锐学Excel数据分析
- 李锐
- 2620字
- 2021-10-19 11:35:14
2.1 TXT文件中的数据,如何批量导入Excel
在实际工作中,很多平台和系统导出的数据都是TXT格式的,那么我们就从文本文件数据的导入开始介绍吧。
为了能游刃有余地应对各种情况,下面结合4个案例展开介绍。
2.1.1 常规文本文件数据的导入
需要导入的文本文件如图2-1所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_30_0_m.jpg?sign=1738925222-szmfyDMT1qZCcwoAjK4INa2hYfQxOoLS-0-ffa9d5bf13bf68c12184df7d0220ae1b)
图2-1
要在Excel中导入文本文件中的数据,有两种方法,一种是利用文本导入工具,另一种是借助Power Query工具,前者是Excel各个版本通用的方法,后者是Excel 2016、Excel 2019和Office 365版本的内置功能,如果使用的是Excel 2013或Excel 2010,需要从微软公司官网下载并安装Power Query插件。
下面就这两种方法,分别展开介绍。
■ 方法一:利用文本导入工具导入
在Excel 2019版本中,文本导入工具位于“数据”选项卡下面的“获取外部数据”组中,如图2-2所示。我们可以调用此工具进行文本数据的导入,方法如下。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_31_0_m.jpg?sign=1738925222-LlK5lJXCDB9BIv8hPSKlz25tcGx1LaSW-0-71891be12409514e6621e507daba854b)
图2-2
01 打开要放置文本数据的Excel工作簿,单击A1单元格,然后单击“数据”选项卡下的“自文本”按钮,弹出“导入文本文件”对话框,选择文本文件所在位置,单击“导入”按钮,如图2-3所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_31_1_l.jpg?sign=1738925222-XEg526UAdiqp5iWQ5MuwWI7WaYrGgaQX-0-afe2abbeb056aa94fa9a5b3f238c8603)
图2-3
02 在文本导入向导的第1步中,按图2-4所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_32_0_m.jpg?sign=1738925222-1VvvmgUYIIGfw468C11cBIcl2xJaPFzW-0-0d78c5d074492b92842f9f0766d7bdb6)
图2-4
03 进入文本导入向导的第2步,按图2-5所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_32_1_m.jpg?sign=1738925222-IpHifwrzsbmhHMThTSBzhtHBCZ92DB3v-0-9f777578cd49e570df0fb54622a9125d)
图2-5
04 进入文本导入向导的第3步,按图2-6所示步骤操作。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_33_0_m.jpg?sign=1738925222-L7P0v8UF5MAaLkffaCLP2HelogxWuiYe-0-83f924311a6e8e19ee07b9d506bebdaf)
图2-6
05 完成文本导入的操作后,设置数据的放置位置,如图2-7所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_33_1_m.jpg?sign=1738925222-2gdlWKZ3NF9S7ix1wmUCC9LBerYhqhcs-0-04e2fb46cbefb1cbcf097f4fa024c23d)
图2-7
06 将数据导入Excel后的效果如图2-8所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_34_0_m.jpg?sign=1738925222-5y7ZfUO8X1WJVA6BMoS20DP8669Jltro-0-2ea40ad538c578f0a51c6953b05b7e7d)
图2-8
■ 方法二:借助Power Query工具导入。
01 单击“数据”选项卡下的“新建查询”按钮→“从文件”→“从文本”,如图2-9所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_34_1_m.jpg?sign=1738925222-3JcHYvgKdpA7MvtP7mW0iCdx81dCSEkC-0-ea77b6d8c8a80c31928e26666e73a369)
图2-9
02 在弹出的对话框中选择要导入的文本文件所在位置,单击“打开”按钮。
03 在弹出的Power Query导入界面中,按图2-10所示步骤操作,加载数据。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_35_0_m.jpg?sign=1738925222-FUjV6fEqViRCLXrR31gvPztbqKCYr71f-0-94e1211d38f6f8afcd7884b9e5294ed1)
图2-10
04 加载数据后的效果如图2-11所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_35_1_l.jpg?sign=1738925222-gwg8vdzl2D6WGHXlmDm3X7SsmM4GGRuR-0-f6c6eb8998ee203c1c0bbd82b285c92c)
图2-11
你会发现,Excel默认将数据创建为超级表而非普通区域。
虽然以上两种方法都可以导入文本文件中的数据,但是显然方法二(借助Power Query导入数据)更加快捷。
不仅如此,当文本文件中的数据变更或向其中追加新的数据时,使用方法二导入Excel中的结果还支持同步更新,仅需单击“刷新”按钮即可,如图2-12所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_0_l.jpg?sign=1738925222-QXZGCThziLFf41bnItHdCJU8a1bjOFA5-0-b2166520b93ae47dbd6d2ecf65a4a5e9)
图2-12
小结
推荐使用Excel 2016、Excel 2019或Office 365版本的用户优先使用Power Query导入文本文件中的数据,低版本用户使用方法一导入数据。
2.1.2 身份证号码等长文本数据的导入
除了常规的数据,实际工作中还可能遇到一些特殊数据,如身份证号码或银行账号等位数较多的数字,这时如果还按照上一小节介绍的步骤导入,会导致部分数据丢失。
下面结合一个案例说明关键步骤的设置方法。
现在有大量18位数字的身份证号码需要导入Excel,由于篇幅有限,仅展示前10行数据,如图2-13所示(已对身份证号码进行脱敏处理)。
由于身份证号码为18位数字,使用常规方法进行导入时,Excel默认只保留15位数字,这样会导致所有身份证号码的后3位数字变为0,如图2-14所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_2_m.jpg?sign=1738925222-koJKlDsb0IPs8O2PgJT2U6iBJMcaOyx9-0-bf84e8038303f153ff2a787f3d21f6b1)
图2-13
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_36_3_m.jpg?sign=1738925222-rAw5knHFoJD853ys36d9mmSICGk1aDcj-0-b2b5ce5941187f27ecd4256a08894306)
图2-14
为了避免这种情况的发生,需要在导入数据时指定身份证号码列按文本格式导入,下面分两种方法介绍关键的设置步骤。
■ 方法一:利用文本导入工具导入
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中选中身份证号码所在的列,将其设置为文本格式,单击“完成”按钮,如图2-15所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_37_0_m.jpg?sign=1738925222-LY7dbXIVemR5jKyBGfN3Dg8TH5ShEfjO-0-65bb5fa46b61378ea7ee00fe8b552b94)
图2-15
02 这样设置后才能完整地导入身份证号码,如图2-16所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_37_1_m.jpg?sign=1738925222-PN6k5YCdx0FrU8BF1BtDgXF1FRpZy0ZL-0-914bb2a33e21b9238d4397d05d379359)
图2-16
■ 方法二:借助Po wer Query工具导入
01 参照2.1.1小节图2-9所示的操作,进入Power Query导入界面后,可见身份证号码列的数字变为科学记数法显示,所以这时不能直接单击“加载”按钮,而要单击“转换数据”按钮,如图2-17所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_38_0_m.jpg?sign=1738925222-JYm4Rsys4wcdrkl5VMy6X3TL5JHX0gls-0-368136194a121897435a628acfd26119)
图2-17
02 进入Power Query编辑器后,界面如图2-18所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_38_1_l.jpg?sign=1738925222-ZSFmuaR9GlgAaDjWHfphF4wgu0Iz4aed-0-e9b934e21c2dc65379cc8eee69b5a372)
图2-18
03 选中身份证号码所在的列,将其转换为文本格式,如图2-19所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_0_l.jpg?sign=1738925222-qDoSJP8SN1JWf9VB03jOk9dX4YOvzw8G-0-568775cfab25541f4f9d19e979d34c43)
图2-19
04 在弹出的对话框中单击“替换当前转换”按钮,如图2-20所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_3_m.jpg?sign=1738925222-AHMvv7fu09gV31gOWqhXXhKGesyVUf2E-0-f0478aca7ed422c35e67e0d0a6c6ce49)
图2-20
05 转换成功后,即可完整显示18位身份证号码,单击“关闭并上载”按钮,将Power Query中的转换结果导入Excel中,如图2-21所示。
06 将数据导入Excel中的结果如图2-22所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_1_m.jpg?sign=1738925222-pOcl11cVe758im9Zin5H0ZGCOZF2eJ6A-0-b733666188b56d2b9b6c8cedf16bb8ac)
图2-21
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_39_2_m.jpg?sign=1738925222-YnwrRp7i4sS9nnf4YcM1cO3B8aYVLDH4-0-160f6808a3280242cd623be4c89e0af3)
图2-22
Excel中的这个结果同样也是支持跟随数据源刷新的,当文本文件中的数据源变动后,在Excel中单击“设计”选项卡下的“刷新”按钮即可同步更新。
2.1.3 从十几个文本字段中删除部分字段再导入Excel
前面两个案例都是将文本文件中所有字段数据导入Excel,实际工作中有时我们只需要数据中的一部分字段,所以可以从数据中删除部分字段再导入。
原始文本文件如图2-23所示。其中的“退款额”和“退货量”无须导入Excel。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_40_0_l.jpg?sign=1738925222-c0OtkcCwj2d9CgKqrSVLI4Y2mK257rEo-0-92f45400aba252ccb09f3d90b3ba0172)
图2-23
下面依然分两种方法展开介绍。
■ 方法一:利用文本导入工具导入
由于前面已经介绍过文本导入工具,所以这里重复的步骤不赘述。
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中,依次选中无须导入的字段所在的列,选中“不导入此列(跳过)”单选项,单击“完成”按钮,如图2-24所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_40_1_m.jpg?sign=1738925222-XY05fFJ6CDldtDgHCn1KUOzNk1Mz6lUk-0-8cd263401edb499e2972f7db8766ba25)
图2-24
02 这样即可忽略无须导入的字段,将数据导入Excel中,如图2-25所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_41_0_m.jpg?sign=1738925222-G2AAM3jud7eZMrXlOEOgBKeAdN2YR187-0-91004266da0e5e0f9c6a5775461def2e)
图2-25
■ 方法二:借助Power Query工具导入
01 在“数据”选项卡下单击“从文本/CSV”按钮,将文本文件中的数据导入Power Query。在Power Query导入界面单击“转换数据”按钮,如图2-26所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_41_1_l.jpg?sign=1738925222-bFzdddjQZaV1cx4rzYSf5wSBfzHqF0zX-0-690e9169fbaf0876562536cceac0970f)
图2-26
02 在Power Query编辑器中,按住<Ctrl>键不松开并依次选中无须导入的两列,单击“删除列”按钮,如图2-27所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_0_l.jpg?sign=1738925222-p4PiRCLW3A7yQRVFVlBMc2y2A1W40HQN-0-2c209e901b49df38d0aebe7ad3f5f0c3)
图2-27
03 单击“关闭并上载”按钮将Power Query中的转换结果导入Excel中,如图2-28所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_1_l.jpg?sign=1738925222-b8r9xxh59mOahUrCif5gjGVUSSdFWBf1-0-cd94a7bf436703fe95cb74fad5584b6a)
图2-28
04 Excel中的结果如图2-29所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_42_2_l.jpg?sign=1738925222-gNMIdiqq6Up8EfyhesnhTjiqtsPsaiWY-0-a86c57685cf80247a0b3505bd6c6ce9d)
图2-29
2.1.4 从字段中选择性导入数据
当文本文件中需要删除的字段太多时,我们可以仅选择需要导入的字段进行导入。
原始文件中包含几十列数据,如图2-30所示,仅需导入前面的从“日期”至“转化率”的10个字段,后面的几十个字段数据无须导入。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_43_0_l.jpg?sign=1738925222-jKXSYuerLHWBmjY123Y0P3u0PnqeKLJu-0-940978118a7a3b4951351c0dd9ef85b9)
图2-30
下面依然分两种方法展开介绍。
■ 方法一:利用文本导入工具导入
01 参照2.1.1小节图2-3~图2-6所示的操作,在文本导入向导第3步对应的对话框中(如图2-31所示),先单击“退款额”所在的列,再按住鼠标左键不松开并向右拖动底部的滚动条直至最后一列。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_43_1_m.jpg?sign=1738925222-6gb5BxwwCtzum3pbf4LoJUDf63IpgYVr-0-bbcba3a377c1688ee8b19aabd59226fa)
图2-31
02 按住<Shift>键不松开并单击最后一列(“星期”字段所在的列),目的是选中从“退款额”至“星期”的连续几十列,然后选中“不导入此列(跳过)”单选项,单击“完成”按钮,如图2-32所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_44_0_m.jpg?sign=1738925222-Hy5jnABcZ8wnwZhkRCTwvIC3wCJz4loG-0-b71592f24b0d9af16d2732f1be876360)
图2-32
03 这样即可忽略无须导入的几十列,仅导入有效数据,如图2-33所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_44_1_m.jpg?sign=1738925222-KIZl7LlsuokJw30Sux7tJnIislJ8O3Ho-0-46a4393932f3e676aab3d533dec4e78f)
图2-33
■ 方法二:借助Power Query工具导入
01 参照2. 1.2小节图2-9、图2-10所示的操作,将数据导入Power Query编辑器后,按住<Shift>键不松开并依次单击“日期”列和“转化率”列,目的是选中这些需要导入的连续多列数据,然后单击“删除列”按钮的下半部分,在弹出的下拉菜单中选择“删除其他列”,如图2-34所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_0_l.jpg?sign=1738925222-Z3hnl3EiVcIBp0KzuZCfDuWFFHifx84x-0-a648a5b1f5b9e97c1e51e4eaea1f06b4)
图2-34
02 在Power Query中转换得到想要的结果后,单击“关闭并上载”按钮,如图2-35所示。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_1_l.jpg?sign=1738925222-x8JzeP04LDAUU1YANmL7Iz2pXCqOfHod-0-ba919b175bac007abcafc204d192d9c4)
图2-35
03 Excel中的效果如图2-36所示。
当然,借助Power Query导入的这些数据,可以借助“刷新”功能使之与数据源保持同步更新,这也是使用Power Query的极大优势所在。
![](https://epubservercos.yuewen.com/05BEE5/21407138601440706/epubprivate/OEBPS/Images/image_45_2_l.jpg?sign=1738925222-6PkL6zEigReHcCv6pgDHqobqzecoqNFw-0-a961a6180fec054ee1d5d9f49e3b9b7a)
图2-36