protrait

2025-08-12 04:49:03 +08:00 · 2020-11-21 20:57:51 -07:00 · 2020-11-21 20:57:51 -07:00 · f35fc1df19
commit f35fc1df19
parent c6d4a284e7
46 changed files with 33619 additions and 0 deletions
--- a/README.md
+++ b/README.md
@ -14,6 +14,26 @@ __Contact__: xuebin[at]ualberta[dot]ca

 ## Updates !!!

+**(2020-Nov-21)** We found a interesting application of U^2-Net for [**human protrait drawing**](https://www.pythonf.cn/read/141098). Therefore, we trained another model for this task based on the [**APDrawingGAN dataset**](https://github.com/yiranran/APDrawingGAN).
+
+[!Sample Results: Kids](figures/portrait_kids.png)
+
+[!Sample Results: Ladies](figures/portrait_ladies.png)
+
+[!Sample Results: Men](figures/portrait_men.png)
+
+### Usage
+1. Clone this repo to local
+```
+git clone https://github.com/NathanUA/U-2-Net.git
+```
+
+2. Download the [**U2net_portrait.pth**](https://drive.google.com/file/d/1IG3HdpcRiDoWNookbncQjeaPN28t90yW/view?usp=sharing) model and put it into the directory: ```./saved_models/u2net_portrait/```.
+
+3. Run on the testing set. Download the train and test set  from [**APDrawingGAN**](https://github.com/yiranran/APDrawingGAN). These images and their ground truth are stitched side-by-side (512x1024). You need to split each of these images into two 512x512 images and put them into ```./test_data/test_portrait_images/portrait_im/``. You can also download the split testing set [**here**](https://drive.google.com/file/d/1NkTsDDN8VO-JVik6VxXyV-3l2eo29KCk/view?usp=sharing). Running the inference with command ```python u2net_portrait_test.py``` will ouptut the results into ```./test_data/test_portrait_images/portrait_results```. 
+
+4. Run on your own dataset. Prepare your images and put them into ```./test_data/test_portrait_images/your_portrait_im/```. Run the prediction by command ```python u2net_portrait_demo.py``` The difference of the code for runing the test set and your own dataset is that the testing set are normalized and cropped to 512x512 for including only head of human, while your own dataset may varies with different resolution and contents. To achieve stable results, we added a simple [**face detection**](https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_objdetect/py_face_detection/py_face_detection.html) step before the portrait generation in ```u2net_portrait_demo.py```. Therefore, the code will detect the biggest face from the given image and then crop, pad and resize the ROI to 512x512 for feeding to the network. 
+
 **(2020-Sep-13)** Our U^2-Net based model is the **6th** in [**MICCAI 2020 Thyroid Nodule Segmentation Challenge**](https://tn-scui2020.grand-challenge.org/Resultannouncement/).

 **(2020-May-18)** The official paper of our **U^2-Net (U square net)** ([**PDF in elsevier**(free until July 5 2020)](https://www.sciencedirect.com/science/article/pii/S0031320320302077?dgcid=author), [**PDF in arxiv**](http://arxiv.org/abs/2005.09007)) is now available. If you are not able to access that, please feel free to drop me an email.
@ -34,6 +54,7 @@ __Contact__: xuebin[at]ualberta[dot]ca
 Python 3.6  
 numpy 1.15.2  
 scikit-image 0.14.0  
+python-opencv
 PIL 5.2.0  
 PyTorch 0.4.0  
 torchvision 0.2.1  
--- a/pycache/data_loader.cpython-37.pyc
+++ b/pycache/data_loader.cpython-37.pyc
--- a/figures/portrait_kids.png
+++ b/figures/portrait_kids.png
--- a/figures/portrait_ladies.png
+++ b/figures/portrait_ladies.png
--- a/figures/portrait_men.png
+++ b/figures/portrait_men.png
--- a/model/pycache/init.cpython-37.pyc
+++ b/model/pycache/init.cpython-37.pyc
--- a/model/pycache/u2net.cpython-37.pyc
+++ b/model/pycache/u2net.cpython-37.pyc
--- a/saved_models/face_detection_cv2/haarcascade_frontalface_default.xml
+++ b/saved_models/face_detection_cv2/haarcascade_frontalface_default.xml
--- a/test_data/test_portrait_images/portrait_im/img_1585.png
+++ b/test_data/test_portrait_images/portrait_im/img_1585.png
--- a/test_data/test_portrait_images/portrait_im/img_1588.png
+++ b/test_data/test_portrait_images/portrait_im/img_1588.png
--- a/test_data/test_portrait_images/portrait_im/img_1594.png
+++ b/test_data/test_portrait_images/portrait_im/img_1594.png
--- a/test_data/test_portrait_images/portrait_im/img_1616.png
+++ b/test_data/test_portrait_images/portrait_im/img_1616.png
--- a/test_data/test_portrait_images/portrait_im/img_1695.png
+++ b/test_data/test_portrait_images/portrait_im/img_1695.png
--- a/test_data/test_portrait_images/portrait_im/img_1696.png
+++ b/test_data/test_portrait_images/portrait_im/img_1696.png
--- a/test_data/test_portrait_images/portrait_im/img_1771.png
+++ b/test_data/test_portrait_images/portrait_im/img_1771.png
--- a/test_data/test_portrait_images/portrait_im/img_1859.png
+++ b/test_data/test_portrait_images/portrait_im/img_1859.png
--- a/test_data/test_portrait_images/portrait_results/img_1585.png
+++ b/test_data/test_portrait_images/portrait_results/img_1585.png
--- a/test_data/test_portrait_images/portrait_results/img_1588.png
+++ b/test_data/test_portrait_images/portrait_results/img_1588.png
--- a/test_data/test_portrait_images/portrait_results/img_1594.png
+++ b/test_data/test_portrait_images/portrait_results/img_1594.png
--- a/test_data/test_portrait_images/portrait_results/img_1616.png
+++ b/test_data/test_portrait_images/portrait_results/img_1616.png
--- a/test_data/test_portrait_images/portrait_results/img_1695.png
+++ b/test_data/test_portrait_images/portrait_results/img_1695.png
--- a/test_data/test_portrait_images/portrait_results/img_1696.png
+++ b/test_data/test_portrait_images/portrait_results/img_1696.png
--- a/test_data/test_portrait_images/portrait_results/img_1771.png
+++ b/test_data/test_portrait_images/portrait_results/img_1771.png
--- a/test_data/test_portrait_images/portrait_results/img_1859.png
+++ b/test_data/test_portrait_images/portrait_results/img_1859.png
--- a/test_data/test_portrait_images/your_portrait_im/GalGadot.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/GalGadot.jpg
--- a/test_data/test_portrait_images/your_portrait_im/guliNazha3.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/guliNazha3.jpg
--- a/test_data/test_portrait_images/your_portrait_im/kid1.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/kid1.jpg
--- a/test_data/test_portrait_images/your_portrait_im/kid2.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/kid2.jpg
--- a/test_data/test_portrait_images/your_portrait_im/kid3.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/kid3.jpg
--- a/test_data/test_portrait_images/your_portrait_im/man.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/man.jpg
--- a/test_data/test_portrait_images/your_portrait_im/man2.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/man2.jpg
--- a/test_data/test_portrait_images/your_portrait_im/man4.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/man4.jpg
--- a/test_data/test_portrait_images/your_portrait_im/man5.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/man5.jpg
--- a/test_data/test_portrait_images/your_portrait_im/smile.jpg
+++ b/test_data/test_portrait_images/your_portrait_im/smile.jpg
--- a/test_data/test_portrait_images/your_portrait_results/GalGadot.png
+++ b/test_data/test_portrait_images/your_portrait_results/GalGadot.png
--- a/test_data/test_portrait_images/your_portrait_results/guliNazha3.png
+++ b/test_data/test_portrait_images/your_portrait_results/guliNazha3.png
--- a/test_data/test_portrait_images/your_portrait_results/kid1.png
+++ b/test_data/test_portrait_images/your_portrait_results/kid1.png
--- a/test_data/test_portrait_images/your_portrait_results/kid2.png
+++ b/test_data/test_portrait_images/your_portrait_results/kid2.png
--- a/test_data/test_portrait_images/your_portrait_results/kid3.png
+++ b/test_data/test_portrait_images/your_portrait_results/kid3.png
--- a/test_data/test_portrait_images/your_portrait_results/man.png
+++ b/test_data/test_portrait_images/your_portrait_results/man.png
--- a/test_data/test_portrait_images/your_portrait_results/man2.png
+++ b/test_data/test_portrait_images/your_portrait_results/man2.png
--- a/test_data/test_portrait_images/your_portrait_results/man4.png
+++ b/test_data/test_portrait_images/your_portrait_results/man4.png
--- a/test_data/test_portrait_images/your_portrait_results/man5.png
+++ b/test_data/test_portrait_images/your_portrait_results/man5.png
--- a/test_data/test_portrait_images/your_portrait_results/smile.png
+++ b/test_data/test_portrait_images/your_portrait_results/smile.png
--- a/u2net_portrait_demo.py
+++ b/u2net_portrait_demo.py
@ -0,0 +1,167 @@
+import cv2
+import torch
+from model import U2NET
+from torch.autograd import Variable
+import numpy as np
+from glob import glob
+import os
+
+def detect_single_face(face_cascade,img):
+    # Convert into grayscale
+    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
+
+    # Detect faces
+    faces = face_cascade.detectMultiScale(gray, 1.1, 4)
+    if(len(faces)==0):
+        print("Warming: no face detection, the portrait u2net will run on the whole image!")
+        return None
+
+    # filter to keep the largest face
+    wh = 0
+    idx = 0
+    for i in range(0,len(faces)):
+        (x,y,w,h) = faces[i]
+        if(wh<w*h):
+            idx = i
+            wh = w*h
+
+    return faces[idx]
+
+# crop, pad and resize face region to 512x512 resolution
+def crop_face(img, face):
+
+    # no face detected, return the whole image and the inference will run on the whole image
+    if(face is None):
+        return img
+    (x, y, w, h) = face
+
+    height,width = img.shape[0:2]
+
+    # crop the face with a bigger bbox
+    hmw = h - w
+    hpad = int(h/2)+1
+    wpad = int(w/2)+1
+
+    l,r,t,b = 0,0,0,0
+    left = x-wpad
+    if(left<0):
+        left = 0
+        l = wpad-x
+    right = x+w+wpad
+    if(right>width):
+        right = width
+        r = right-width
+    top = y - hpad
+    if(top<0):
+        top = 0
+        t = hpad-y
+    bottom = y+h+int(hpad*0.5)
+    if(bottom>height):
+        bottom = height
+        b = bottom-height
+
+    im_face = img[top:bottom,left:right]
+    if(len(im_face.shape)==2):
+        im_face = np.repeat(im_face[:,:,np.newaxis],(1,1,3))
+
+    im_face = np.pad(im_face,((t,b),(l,r),(0,0)),mode='constant',constant_values=((255,255),(255,255),(255,255)))
+
+    # pad to achieve image with square shape for avoding face deformation after resizing
+    hf,wf = im_face.shape[0:2]
+    if(hf-2>wf):
+        wfp = int((hf-wf)/2)
+        im_face = np.pad(im_face,((0,0),(wfp,wfp),(0,0)),mode='constant',constant_values=((255,255),(255,255),(255,255)))
+    elif(wf-2>hf):
+        hfp = int((wf-hf)/2)
+        im_face = np.pad(im_face,((hfp,hfp),(0,0),(0,0)),mode='constant',constant_values=((255,255),(255,255),(255,255)))
+
+    # resize to have 512x512 resolution
+    im_face = cv2.resize(im_face, (512,512), interpolation = cv2.INTER_AREA)
+
+    return im_face
+
+def normPRED(d):
+    ma = torch.max(d)
+    mi = torch.min(d)
+
+    dn = (d-mi)/(ma-mi)
+
+    return dn
+
+def inference(net,input):
+
+    # normalize the input
+    tmpImg = np.zeros((input.shape[0],input.shape[1],3))
+    input = input/np.max(input)
+
+    tmpImg[:,:,0] = (input[:,:,2]-0.406)/0.225
+    tmpImg[:,:,1] = (input[:,:,1]-0.456)/0.224
+    tmpImg[:,:,2] = (input[:,:,0]-0.485)/0.229
+
+    # convert BGR to RGB
+    tmpImg = tmpImg.transpose((2, 0, 1))
+    tmpImg = tmpImg[np.newaxis,:,:,:]
+    tmpImg = torch.from_numpy(tmpImg)
+
+    # convert numpy array to torch tensor
+    tmpImg = tmpImg.type(torch.FloatTensor)
+
+    if torch.cuda.is_available():
+        tmpImg = Variable(tmpImg.cuda())
+    else:
+        tmpImg = Variable(tmpImg)
+
+    # inference
+    d1,d2,d3,d4,d5,d6,d7= net(tmpImg)
+
+    # normalization
+    pred = 1.0 - d1[:,0,:,:]
+    pred = normPRED(pred)
+
+    # convert torch tensor to numpy array
+    pred = pred.squeeze()
+    pred = pred.cpu().data.numpy()
+
+    del d1,d2,d3,d4,d5,d6,d7
+
+    return pred
+
+def main():
+
+    # get the image path list for inference
+    im_list = glob('./test_data/test_portrait_images/your_portrait_im/*')
+    print("Number of images: ",len(im_list))
+    # indicate the output directory
+    out_dir = './test_data/test_portrait_images/your_portrait_results'
+    if(not os.path.exists(out_dir)):
+        os.mkdir(out_dir)
+
+    # Load the cascade face detection model
+    face_cascade = cv2.CascadeClassifier('./saved_models/face_detection_cv2/haarcascade_frontalface_default.xml')
+    # u2net_portrait path
+    model_dir = './saved_models/u2net_portrait/u2net_portrait.pth'
+
+    # load u2net_portrait model
+    net = U2NET(3,1)
+    net.load_state_dict(torch.load(model_dir))
+    if torch.cuda.is_available():
+        net.cuda()
+    net.eval()
+
+    # do the inference one-by-one
+    for i in range(0,len(im_list)):
+        print("--------------------------")
+        print("inferencing ", i, "/", len(im_list), im_list[i])
+
+        # load each image
+        img = cv2.imread(im_list[i])
+        height,width = img.shape[0:2]
+        face = detect_single_face(face_cascade,img)
+        im_face = crop_face(img, face)
+        im_portrait = inference(net,im_face)
+
+        # save the output
+        cv2.imwrite(out_dir+"/"+im_list[i].split('/')[-1][0:-4]+'.png',(im_portrait*255).astype(np.uint8))
+
+if __name__ == '__main__':
+    main()
--- a/u2net_portrait_test.py
+++ b/u2net_portrait_test.py
@ -0,0 +1,117 @@
+import os
+from skimage import io, transform
+import torch
+import torchvision
+from torch.autograd import Variable
+import torch.nn as nn
+import torch.nn.functional as F
+from torch.utils.data import Dataset, DataLoader
+from torchvision import transforms#, utils
+# import torch.optim as optim
+
+import numpy as np
+from PIL import Image
+import glob
+
+from data_loader import RescaleT
+from data_loader import ToTensor
+from data_loader import ToTensorLab
+from data_loader import SalObjDataset
+
+from model import U2NET # full size version 173.6 MB
+from model import U2NETP # small version u2net 4.7 MB
+
+# normalize the predicted SOD probability map
+def normPRED(d):
+    ma = torch.max(d)
+    mi = torch.min(d)
+
+    dn = (d-mi)/(ma-mi)
+
+    return dn
+
+def save_output(image_name,pred,d_dir):
+
+    predict = pred
+    predict = predict.squeeze()
+    predict_np = predict.cpu().data.numpy()
+
+    im = Image.fromarray(predict_np*255).convert('RGB')
+    img_name = image_name.split(os.sep)[-1]
+    image = io.imread(image_name)
+    imo = im.resize((image.shape[1],image.shape[0]),resample=Image.BILINEAR)
+
+    pb_np = np.array(imo)
+
+    aaa = img_name.split(".")
+    bbb = aaa[0:-1]
+    imidx = bbb[0]
+    for i in range(1,len(bbb)):
+        imidx = imidx + "." + bbb[i]
+
+    imo.save(d_dir+'/'+imidx+'.png')
+
+def main():
+
+    # --------- 1. get image path and name ---------
+    model_name='u2net_portrait'#u2netp
+
+
+    image_dir = './test_data/test_portrait_images/portrait_im'
+    prediction_dir = './test_data/test_portrait_images/portrait_results'
+    if(not os.path.exists(prediction_dir)):
+        os.mkdir(prediction_dir)
+
+    model_dir = './saved_models/u2net_portrait/u2net_portrait.pth'
+
+    img_name_list = glob.glob(image_dir+'/*')
+    print("Number of images: ", len(img_name_list))
+
+    # --------- 2. dataloader ---------
+    #1. dataloader
+    test_salobj_dataset = SalObjDataset(img_name_list = img_name_list,
+                                        lbl_name_list = [],
+                                        transform=transforms.Compose([RescaleT(512),
+                                                                      ToTensorLab(flag=0)])
+                                        )
+    test_salobj_dataloader = DataLoader(test_salobj_dataset,
+                                        batch_size=1,
+                                        shuffle=False,
+                                        num_workers=1)
+
+    # --------- 3. model define ---------
+
+    print("...load U2NET---173.6 MB")
+    net = U2NET(3,1)
+
+    net.load_state_dict(torch.load(model_dir))
+    if torch.cuda.is_available():
+        net.cuda()
+    net.eval()
+
+    # --------- 4. inference for each image ---------
+    for i_test, data_test in enumerate(test_salobj_dataloader):
+
+        print("inferencing:",img_name_list[i_test].split(os.sep)[-1])
+
+        inputs_test = data_test['image']
+        inputs_test = inputs_test.type(torch.FloatTensor)
+
+        if torch.cuda.is_available():
+            inputs_test = Variable(inputs_test.cuda())
+        else:
+            inputs_test = Variable(inputs_test)
+
+        d1,d2,d3,d4,d5,d6,d7= net(inputs_test)
+
+        # normalization
+        pred = 1.0 - d1[:,0,:,:]
+        pred = normPRED(pred)
+
+        # save results to test_results folder
+        save_output(img_name_list[i_test],pred,prediction_dir)
+
+        del d1,d2,d3,d4,d5,d6,d7
+
+if __name__ == "__main__":
+    main()