云主机测评网云主机测评网云主机测评网

云主机测评网
www.yunzhuji.net

pandas .str.split详解

pandas.str.split详解

(图片来源网络,侵删)

pandas.str.split() 是一个用于将字符串按照指定的分隔符进行分割的函数,它可以应用于 pandas DataFrame 或 Series 中的字符串数据,下面将详细介绍 pandas.str.split() 的使用方法和参数。

1. 基本用法

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割
result = data.str.split(',')
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

2. 设置 maxsplit 参数

maxsplit 参数用于指定最大分割次数,默认值为 1,表示不限制分割次数。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,最多分割一次
result = data.str.split(',', n=1)
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

3. 设置 expand 参数

expand 参数用于控制是否将分割后的结果展开为一个新的 DataFrame,默认值为 False,表示不展开。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,并将结果展开为一个新的 DataFrame
result = data.str.split(',', expand=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i

4. 设置 regex 参数

regex 参数用于控制是否使用正则表达式进行分割,默认值为 False,表示不使用正则表达式。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i'])
使用逗号和分号作为分隔符进行分割,并使用正则表达式进行分割
result = data.str.split('[,;|]', regex=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i
打赏
版权声明:主机测评不销售、不代购、不提供任何支持,仅分享信息/测评(有时效性),自行辨别,请遵纪守法文明上网。
文章名称:《pandas .str.split详解》
文章链接:https://www.yunzhuji.net/jishujiaocheng/45582.html

评论

  • 验证码