在Pandas中,将变量添加到字符串列中的每个值。

huangapple go评论81阅读模式
英文:

Add a variable to each value in a string column using Pandas

问题

我尝试为数据框的每个元素添加一个变量,但输出不符合预期。希望获得以下输出:

                     Specifieke_omschrijving_beheerobject Systeemdeelnummer
    0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord  007-0010-R.1
    25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...  007-0020-R.2
    862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever  007-0040-R.3
英文:

I have a dataframe beheerobjecten:

                  Specifieke_omschrijving_beheerobject Systeemdeelnummer
0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord  007-0010-R
25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...  007-0020-R
862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever  007-0040-R

With the following code I try add a variable to each element in the dataframe:

count = 1
while count < len(beheerobjecten):
    beheerobjecten["Systeemdeelnummer"] = beheerobjecten["Systeemdeelnummer"].apply(lambda x: f"{x}.{count}")
    count += 1

I get the following output:

                  Specifieke_omschrijving_beheerobject Systeemdeelnummer
0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord    007-0010-R.1.2
25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...    007-0020-R.1.2
862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever    007-0040-R.1.2

However, I try to obtain this output:

                 Specifieke_omschrijving_beheerobject Systeemdeelnummer
0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord  007-0010-R.1
25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...  007-0020-R.2
862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever  007-0040-R.3

答案1

得分: 0

这是一种方法来完成这个任务:

ser = beheerobjecten["Systeemdeelnummer"].astype(bool).cumsum().astype(str)

#另一种变体
#ser = pd.Series(range(1, len(beheerobjecten)+1), dtype="str", index=beheerobjecten.index)

beheerobjecten["Systeemdeelnummer"] = beheerobjecten["Systeemdeelnummer"].str.cat(ser, sep=".")

输出:

print(beheerobjecten)
    
                       pecifieke_omschrijving_beheerobject Systeemdeelnummer
0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord      007-0010-R.1
25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...      007-0020-R.2
862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever      007-0040-R.3
英文:

Here is one way to do it :

ser = beheerobjecten["Systeemdeelnummer"].astype(bool).cumsum().astype(str)
​
#another variant
#ser = pd.Series(range(1, len(beheerobjecten)+1), dtype="str", index=beheerobjecten.index)
​
beheerobjecten["Systeemdeelnummer"] = beheerobjecten["Systeemdeelnummer"].str.cat(ser, sep=".")


Output :

print(beheerobjecten)

                   pecifieke_omschrijving_beheerobject Systeemdeelnummer
0    Weg, 4,300 tm 16,765 KP Zaandam - Purmerend Noord      007-0010-R.1
25   Weg, 16,765 tm 34,032 Purmerend Noord - Hoorn ...      007-0020-R.2
862       Weg, 50,212 tm 64,565 Middenmeer - Den Oever      007-0040-R.3

huangapple
  • 本文由 发表于 2023年5月22日 18:23:01
  • 转载请务必保留本文链接:https://go.coder-hub.com/76305200.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定