pandas.str.split详解
(图片来源网络,侵删)pandas.str.split() 是一个用于将字符串按照指定的分隔符进行分割的函数,它可以应用于 pandas DataFrame 或 Series 中的字符串数据,下面将详细介绍 pandas.str.split() 的使用方法和参数。
1. 基本用法
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割 result = data.str.split(',') print(result)
输出结果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
2. 设置 maxsplit 参数
maxsplit
参数用于指定最大分割次数,默认值为 1,表示不限制分割次数。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割,最多分割一次 result = data.str.split(',', n=1) print(result)
输出结果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
3. 设置 expand 参数
expand
参数用于控制是否将分割后的结果展开为一个新的 DataFrame,默认值为 False,表示不展开。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i']) 使用逗号作为分隔符进行分割,并将结果展开为一个新的 DataFrame result = data.str.split(',', expand=True) print(result)
输出结果:
0 1 2 0 a b c 1 d e f 2 g h i
4. 设置 regex 参数
regex
参数用于控制是否使用正则表达式进行分割,默认值为 False,表示不使用正则表达式。
import pandas as pd 创建一个包含字符串的 Series data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i']) 使用逗号和分号作为分隔符进行分割,并使用正则表达式进行分割 result = data.str.split('[,;|]', regex=True) print(result)
输出结果:
0 1 2 0 a b c 1 d e f 2 g h i
最新评论
本站CDN与莫名CDN同款、亚太CDN、速度还不错,值得推荐。
感谢推荐我们公司产品、有什么活动会第一时间公布!
我在用这类站群服务器、还可以. 用很多年了。