问题

我有这样一个循环，从一个名为 df_labels 的 DataFrame 中获取问题，看起来像是对于会话 21100511290882536：

"session_id"      "question" "correct"
21100511290882536	1	1
21100511290882536	2	1
21100511290882536	3	1
21100511290882536	4	1
21100511290882536	5	0
21100511290882536	6	1
21100511290882536	7	1
21100511290882536	8	0
21100511290882536	9	1
21100511290882536	10	1
21100511290882536	11	1
21100511290882536	12	1
21100511290882536	13	0
21100511290882536	14	1
21100511290882536	15	1
21100511290882536	16	1
21100511290882536	17	1
21100511290882536	18	1

而我想要将其和所有其他会话转换成一个如下的 DataFrame：

"session_id"	   "q_1"   "q_2"  "q_3"   "q_4"	...
21100511290882536    1        1     1       1   ...

我已经有一个名为 "df_sessions" 的 DataFrame，列出了所有的会话。

for session in df_sessions.session_id:
    for i in range(1, 19):
        df_sessions[f'q_{i}'][df_sessions['session_id'] == session] = df_labels.correct[(df_labels['session_id'] == session) & (df_labels['question'] == i)]

这段代码能够运行，但效率非常低下，对于这样的操作需要 20 分钟，并且我可能需要进行更多类似的操作，这将导致代码效率和计算时间非常差。非常感谢您的帮助！

英文:

I have this loop where i take questions from a DataFrame df_labels that looks like that for session 21100511290882536:

&quot;session_id&quot;      &quot;question&quot; &quot;correct&quot;
21100511290882536	1	1
21100511290882536	2	1
21100511290882536	3	1
21100511290882536	4	1
21100511290882536	5	0
21100511290882536	6	1
21100511290882536	7	1
21100511290882536	8	0
21100511290882536	9	1
21100511290882536	10	1
21100511290882536	11	1
21100511290882536	12	1
21100511290882536	13	0
21100511290882536	14	1
21100511290882536	15	1
21100511290882536	16	1
21100511290882536	17	1
21100511290882536	18	1

and i would like to convert it and all other sessions to a dataframe like this:

&quot;session_id&quot;	   &quot;q_1&quot;   &quot;q_2&quot;  &quot;q_3&quot;   &quot;q_4&quot;	...
21100511290882536    1        1     1       1   ...

knowing i already have a DataFrame "df_sessions" listing all the sessions

for session in df_sessions.session_id:
    for i in range(1,19):
        df_sessions[f&#39;q_{i}&#39;][df_sessions[&#39;session_id&#39;] == session] = df_labels.correct[(df_labels[&#39;session_id&#39;] == session) &amp; (df_labels[&#39;question&#39;] == i)]

This code works but is very ineficient, it takes 20 minutes for such an operation and i might need to do more operation like this thus leading to very poor code efficiency and computing time.
Thx in advance for your help !

答案1

得分: 2

尝试：

(df.assign(question='q_' + df['question'].astype(str).str.zfill(2))
   .pivot(index='session_id', columns='question', values='correct')
   .rename_axis(columns=None).reset_index())
       
          session_id  q_01  q_02  q_03  q_04  q_05  q_06  q_07  q_08  q_09  q_10  q_11  q_12  q_13  q_14  q_15  q_16  q_17  q_18
0  21100511290882536     1     1     1     1     0     1     1     0     1     1     1     1     0     1     1     1     1     1

英文:

Try:

&gt;&gt;&gt; (df.assign(question=&#39;q_&#39; + df[&#39;question&#39;].astype(str).str.zfill(2))
       .pivot(index=&#39;session_id&#39;, columns=&#39;question&#39;, values=&#39;correct&#39;)
       .rename_axis(columns=None).reset_index())
       
          session_id  q_01  q_02  q_03  q_04  q_05  q_06  q_07  q_08  q_09  q_10  q_11  q_12  q_13  q_14  q_15  q_16  q_17  q_18
0  21100511290882536     1     1     1     1     0     1     1     0     1     1     1     1     0     1     1     1     1     1

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

DataFrame 操作在循环中非常低效，不知道如何修复它。

问题

答案1

Python脚本令牌刷新机制问题，用于Spotify API

无法在discord.py中的斜杠命令中访问公会ID。

如何绘制带有每列和行描述的矩阵

计算定义错误？

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论