Now it's two allocations. I don't see much downside to that,
since the two pieces were in different cache lines anyway.
Rename 'conservative' to 'cgo_conservative_type' and make
clear that _cgo_allocate is the only allowed user.
This depends on CL 
141490043, which removes the other
use of conservative (in defer).
LGTM=dvyukov, iant
R=khr, dvyukov, iant
CC=golang-codereviews, rlh
https://golang.org/cl/
139610043
 
 void callGoFoo(void);
 void callGoStackCheck(void);
 void callPanic(void);
+void callCgoAllocate(void);
 */
 import "C"
 
        C.callPanic()
 }
 
+func testAllocateFromC(t *testing.T) {
+       C.callCgoAllocate() // crashes or exits on failure
+}
+
 func testCallbackStack(t *testing.T) {
        // Make cgo call and callback with different amount of stack stack available.
        // We do not do any explicit checks, just ensure that it does not crash.
 
 // +build gc
 
 #include "_cgo_export.h"
+#include <stdint.h>
+#include <stdio.h>
+#include <stdlib.h>
 
 /* Test calling panic from C.  This is what SWIG does.  */
 
 extern void crosscall2(void (*fn)(void *, int), void *, int);
 extern void _cgo_panic(void *, int);
+extern void _cgo_allocate(void *, int);
 
 void
 callPanic(void)
        crosscall2(_cgo_panic, &a, sizeof a);
        *(int*)1 = 1;
 }
+
+/* Test calling cgo_allocate from C. This is what SWIG does. */
+
+typedef struct List List;
+struct List
+{
+       List *next;
+       int x;
+};
+
+void
+callCgoAllocate(void)
+{
+       int i;
+       struct { size_t n; void *ret; } a;
+       List *l, *head, **tail;
+       
+       head = 0;
+       tail = &head;
+       for(i=0; i<100; i++) {
+               a.n = sizeof *l;
+               crosscall2(_cgo_allocate, &a, sizeof a);
+               l = a.ret;
+               l->x = i;
+               l->next = 0;
+               *tail = l;
+               tail = &l->next;
+       }
+       
+       gc();
+       
+       l = head;
+       for(i=0; i<100; i++) {
+               if(l->x != i) {
+                       fprintf(stderr, "callCgoAllocate: lost memory\n");
+                       exit(2);
+               }
+               l = l->next;
+       }
+       if(l != 0) {
+               fprintf(stderr, "callCgoAllocate: lost memory\n");
+               exit(2);
+       }
+}
+
 
 // +build gccgo
 
 #include "_cgo_export.h"
+#include <stdint.h>
+#include <stdio.h>
+#include <stdlib.h>
 
 /* Test calling panic from C.  This is what SWIG does.  */
 
 extern void _cgo_panic(const char *);
+extern void *_cgo_allocate(size_t);
 
 void
 callPanic(void)
 {
        _cgo_panic("panic from C");
 }
+
+/* Test calling cgo_allocate from C. This is what SWIG does. */
+
+typedef struct List List;
+struct List
+{
+       List *next;
+       int x;
+};
+
+void
+callCgoAllocate(void)
+{
+       int i;
+       List *l, *head, **tail;
+       
+       head = 0;
+       tail = &head;
+       for(i=0; i<100; i++) {
+               l = _cgo_allocate(sizeof *l);
+               l->x = i;
+               l->next = 0;
+               *tail = l;
+               tail = &l->next;
+       }
+       
+       gc();
+       
+       l = head;
+       for(i=0; i<100; i++) {
+               if(l->x != i) {
+                       fprintf(stderr, "callCgoAllocate: lost memory\n");
+                       exit(2);
+               }
+               l = l->next;
+       }
+       if(l != 0) {
+               fprintf(stderr, "callCgoAllocate: lost memory\n");
+               exit(2);
+       }
+}
+
 
 func TestCallbackPanicLoop(t *testing.T)   { testCallbackPanicLoop(t) }
 func TestCallbackPanicLocked(t *testing.T) { testCallbackPanicLocked(t) }
 func TestPanicFromC(t *testing.T)          { testPanicFromC(t) }
+func TestAllocateFromC(t *testing.T)       { testAllocateFromC(t) }
 func TestZeroArgCallback(t *testing.T)     { testZeroArgCallback(t) }
 func TestBlocking(t *testing.T)            { testBlocking(t) }
 func Test1328(t *testing.T)                { test1328(t) }
 
 package cgotest
 
 import "C"
+import "runtime"
 
 //export ReturnIntLong
 func ReturnIntLong() (int, C.long) {
        return 1, 2
 }
+
+//export gc
+func gc() {
+       runtime.GC()
+}
 
                        " mutex struct{};" +
                        " note struct{};" +
                        " p struct{};" +
+                       " parfor struct{};" +
                        " slicetype struct{};" +
                        " stkframe struct{};" +
                        " sudog struct{};" +
 
 // Either we need to add types or we need to stop using it.
 
 func _cgo_allocate_internal(len uintptr) unsafe.Pointer {
-       ret := mallocgc(len, conservative, 0)
+       ret := unsafe.Pointer(&make([]unsafe.Pointer, (len+ptrSize-1)/ptrSize)[0])
        c := new(cgomal)
        c.alloc = ret
        gp := getg()
 
 #pragma dataflag NOPTR
 MStats runtime·memstats;
 
-Type* runtime·conservative;
-
-void runtime·gc_notype_ptr(Eface*);
-
 int32
 runtime·mlookup(void *v, byte **base, uintptr *size, MSpan **sp)
 {
        uintptr limit;
        uint64 i;
        bool reserved;
-       Eface notype_eface;
 
        p = nil;
        p_size = 0;
        // Initialize the rest of the allocator.        
        runtime·MHeap_Init(&runtime·mheap);
        g->m->mcache = runtime·allocmcache();
-
-       runtime·gc_notype_ptr(¬ype_eface);
-       runtime·conservative = notype_eface.type;
 }
 
 void*
 
 void   runtime·tracealloc(void*, uintptr, Type*);
 void   runtime·tracefree(void*, uintptr);
 void   runtime·tracegc(void);
-extern Type*   runtime·conservative;
 
 int32  runtime·gcpercent;
 int32  runtime·readgogc(void);
 
        *ret = (*itab)(nil)
 }
 
-// Type used for "conservative" allocations in C code.
-type notype [8]*byte
-
-// Called from C. Returns the Go type used for C allocations w/o type.
-func gc_notype_ptr(ret *interface{}) {
-       var x notype
-       *ret = x
-}
-
 func gc_unixnanotime(now *int64) {
        sec, nsec := timenow()
        *now = sec*1e9 + int64(nsec)
 
        byte pad[CacheLineSize];
 };
 
-ParFor*
-runtime·parforalloc(uint32 nthrmax)
-{
-       ParFor *desc;
-
-       // The ParFor object is followed by CacheLineSize padding
-       // and then nthrmax ParForThread.
-       desc = (ParFor*)runtime·mallocgc(sizeof(ParFor) + CacheLineSize + nthrmax * sizeof(ParForThread), runtime·conservative, 0);
-       desc->thr = (ParForThread*)((byte*)(desc+1) + CacheLineSize);
-       desc->nthrmax = nthrmax;
-       return desc;
-}
-
 void
 runtime·parforsetup(ParFor *desc, uint32 nthr, uint32 n, void *ctx, bool wait, void (*body)(ParFor*, uint32))
 {
 
 func makeStringSlice(n int) []string {
        return make([]string, n)
 }
+
+// TODO: Move to parfor.go when parfor.c becomes parfor.go.
+func parforalloc(nthrmax uint32) *parfor {
+       return &parfor{
+               thr:     &make([]parforthread, nthrmax)[0],
+               nthrmax: nthrmax,
+       }
+}