问题

Here are the translated code parts:

Method - 1:

#pragma omp parallel for
for (size_t i = 0; i < 1000000; ++i) {

    #pragma omp atomic
    double * p = malloc(sizeof(double) * FIXED_SIZE);

    ....... /* 使用 p 数组进行一些操作 */

    #pragma omp atomic
    free(p);
}

Method - 2:

int num_threads = omp_get_num_threads();
double * p = malloc(sizeof(double) * FIXED_SIZE * num_threads);

#pragma omp parallel for
for (size_t i = 0; i < 1000000; ++i) {

    int thread_num = omp_get_thread_num();

    double * p1 = p + FIXED_SIZE * thread_num;

    ....... /* 使用 p1 数组进行一些操作 */
}
free(p);

英文:

I am bit confused what is a better way to use malloc()/free() in openmp parallel for loop. Here are two ways I thought of but I am not aware of which method is better. I learned from previous answers that malloc/free in loop can fragment the memory.

Suppose I have a loop which runs over million times

for (size_t i = 0 ; i&lt; 1000000; ++i){
    double * p = malloc(sizeof(double)*FIXED_SIZE); 

    /* FIXED_SIZE is some size constant 
    for the entire loop but is only determined dynamically */

    ....... /* Do some stuff using p array */

    free(p);
}

Now I want to parallelize the above loop with openmp

Method -1. simply adding a pragma on top of for loop

#pragma omp parallel for
for (size_t i = 0 ; i&lt; 1000000; ++i){

    #pragma omp atomic
    double * p = malloc(sizeof(double)*FIXED_SIZE); 
    
    ....... /* Do some stuff using p array */

    #pragma omp atomic
    free(p);
}

Method -2. allocate a common array outside loop for each thread

int num_threads = omp_get_num_threads();
double * p = malloc(sizeof(double)*FIXED_SIZE * num_threads); 

#pragma omp parallel for
for (size_t i = 0 ; i&lt; 1000000; ++i){

    int thread_num = omp_get_thread_num();

    double * p1 = p + FIXED_SIZE*thread_num ;
    
    ....... /* Do some stuff using p1 array */
}
free(p);

</details>


# 答案1
**得分**: 2

首先创建一个并行块，为每个线程分配资源，然后将线程拆分以执行并行循环。

```c
#pragma omp parallel
{
  double * p = malloc(sizeof(double) * FIXED_SIZE);

  #pragma omp for
  for (size_t i = 0; i < 1000000; ++i) { ... }

  free(p);
}

英文:

First create a parallel block, allocate resource for each thread and next split threads to do a parallel loop.

#pragma omp parallel
{
  double * p = malloc(sizeof(double)*FIXED_SIZE);

  #pragma omp for
  for (size_t i = 0 ; i&lt; 1000000; ++i) { ... }

  free(p);
}

通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库，让每个人都能够通过互相帮助和分享经验来进步。

malloc in openmp for parallel loop

问题

在Windows C编程中，如何覆盖文本文件中的字符串？

树形数据结构的表示

Go cgo ldap_init 无法确定 C.ldap_init 的名称类型。

Using Pipes for bidirectional communication(Windows API)

What's the correct way to type hint an empty list as a literal in python?

如何在Highcharts Gantt中更改本地化的星期名称

如何在同一个流中使用多个过滤器和映射函数？

如何使用Map/Set来将代码优化到O(n)？

.NET MAUI Android在GitHub Actions上构建失败，错误代码为1。

如何在Playwright视觉比较中屏蔽多个定位器？

在C++中，可以使用可变模板参数来检索类型的内部类型。

selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: stale element not found

Creating and opening a URL to log in to Website via Basic Auth with Robot Framework/Selenium (Python)

AG Grid 在上下文菜单中以大文本形式打开

发表评论